Gene Cfla_1967 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cfla_1967
Symbol
ID	9145861
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cellulomonas flavigena DSM 20109
Kingdom	Bacteria
Replicon accession	NC_014151
Strand	-
Start bp	2188983
End bp	2190641
Gene Length	1659 bp
Protein Length	552 aa
Translation table	11
GC content	69%
IMG OID
Product	SSS sodium solute transporter superfamily
Protein accession	YP_003637061
Protein GI	296129811
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.732438
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	36
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCCGTT ACGACGTCGT CCTCGCAGCG ACCGCCGACG GCGGGCAGGT CGGGGACCCC 
GTGGTCAACA TCGCCATCTT CGGTGCGTTC GTCCTGGTGA CGCTCGTCAT CGTGTTCCGC 
GCGTCGCGCA ACAACAAGAC GGCCGCCGAC TACTACGCGG CCGGTCGCTC CTTCACCGGT 
CCGCAGAACG GCACCGCGAT CGCGGGCGAC TACCTGTCCG CCGCGTCGTT CCTCGGGATC 
TGCGGCGCTA TCGCGATCTA CGGCTACGAC GGGTTCCTCT ACTCCATCGG GTTCCTCGTC 
GCGTGGCTCG TGGCGCTCCT GCTCGTGGCG GAGCTCCTGC GCAACACCGG GCGCTTCACG 
ATGGCCGACG TGCTGTCGTT CCGGCTCCGC CAGCGCCCGG TGCGCCTCGC GGCAGCGATC 
TCGACGCTCG CGGTCGTGTT CTTCTACCTG CTGGCGCAGA TGGCCGGCGC GGGCGGCCTC 
GTCGCGCTGC TGCTCGGCAT CGACGGTGTC GCGGGCCAGG GTCTGGTCAT CGCCGTCGTG 
GGCGCGCTGA TGATCCTCTA CGTCCTGGTG GGCGGCATGA AGGGCACCAC CTGGGTGCAG 
ATCATCAAGG CGATCCTGCT CATCGCGGGC GCCGGGATCA TGACGATCTG GGTGCTCGCG 
AGGTACGGGT TCGACCTGTC GGCGCTCCTG CAGGGCGCGA TCGACGCCGG GGGCGAGGAA 
GGCAGCAAGC TCATCGAGCC GGGCAAGCAG TACGGCGCGT CCGCCCTGAC GCAGCTCAAC 
TTCCTGTCGC TGGCCCTCGC GCTGGTCCTC GGCACGGCCG GTCTGCCGCA CGTGCTCATG 
CGCTTCTACA CGGTGCCGTC CGCCAAGGAG GCCCGGCGCT CGGTCGTCTG GGCGATCTGG 
CTCATCGGGA TCTTCTACCT GTTCACGCTC GTGCTGGGCT ACGGCGCCGG AGCGATCGTC 
GGCCCGGAGA CGATCATGGC CTCGCCCGGC AAGGCGAACT CGGCGGCACC CCTGCTCGCC 
TACGAGCTCG GCGGGGTCTT CCTGCTCGGC ATCATCTCGG CCGTCGCGTT CGCCACGATC 
CTCGCGGTCG TCGCCGGCCT GACGATCACC GCCGCGGCGT CGTTCGCGCA CGACATCTAC 
GCGTCGGTCA TCAAGAAGGG GCAGGTCGCC CCCGACGGCG AGGTGCGCGT CGCGCGGATC 
ACGGTGCTGG TCATCGGTGG TCTGGCCATC GTCGGCGGCA TCTTCGCCAA CGGCCAGAAC 
GTCGCGTTCC TCGTGGCCCT CGCCTTCGCG GTCGCCGCGT CGGCCAACCT GCCGACGATC 
ATCTACTCGC TGTTCTGGAA GCGGTTCAAC ACCGCCGGCG CGCTGTGGAG CATGTACGGC 
GGGCTCATCT CGTGCGTGCT GCTCATCGCC TTCTCGCCGG TCGTGTCCGG CAAGGTCGAC 
CCGACCACCG GTGCCAGCCT GTCGATGATC CGCGACACGT CCATCGACTT CGCGATCTTC 
CCTCTCGAGA ACCCGGGCAT CATCTCGATC CCGCTCGCGT TCCTGCTCGG GATCGTCGGG 
ACGCTGCTGT CCAAGGAGCA GCCGCACCCG GAGAAGTTCG CCGAGATGGA GGTCCGCTCG 
CTCACGGGTG CCGGGGCCGA GAAGGCCTCG GTGCACTAG

Protein sequence

MSRYDVVLAA TADGGQVGDP VVNIAIFGAF VLVTLVIVFR ASRNNKTAAD YYAAGRSFTG 
PQNGTAIAGD YLSAASFLGI CGAIAIYGYD GFLYSIGFLV AWLVALLLVA ELLRNTGRFT 
MADVLSFRLR QRPVRLAAAI STLAVVFFYL LAQMAGAGGL VALLLGIDGV AGQGLVIAVV 
GALMILYVLV GGMKGTTWVQ IIKAILLIAG AGIMTIWVLA RYGFDLSALL QGAIDAGGEE 
GSKLIEPGKQ YGASALTQLN FLSLALALVL GTAGLPHVLM RFYTVPSAKE ARRSVVWAIW 
LIGIFYLFTL VLGYGAGAIV GPETIMASPG KANSAAPLLA YELGGVFLLG IISAVAFATI 
LAVVAGLTIT AAASFAHDIY ASVIKKGQVA PDGEVRVARI TVLVIGGLAI VGGIFANGQN 
VAFLVALAFA VAASANLPTI IYSLFWKRFN TAGALWSMYG GLISCVLLIA FSPVVSGKVD 
PTTGASLSMI RDTSIDFAIF PLENPGIISI PLAFLLGIVG TLLSKEQPHP EKFAEMEVRS 
LTGAGAEKAS VH