Gene GM21_1647 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GM21_1647
Symbol
ID	8136978
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sp. M21
Kingdom	Bacteria
Replicon accession	NC_012918
Strand	+
Start bp	1916241
End bp	1917509
Gene Length	1269 bp
Protein Length	422 aa
Translation table	11
GC content	56%
IMG OID	644869260
Product	ABC transporter related
Protein accession	YP_003021460
Protein GI	253700271
COG category	[G] Carbohydrate transport and metabolism [M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1134] ABC-type polysaccharide/polyol phosphate transport system, ATPase component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	193
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATAAGTG TGGAGAACAT CGGGAAACGG TACACCATTT CCCATAGAGG GAGTGACAGC 
AACCACAGTA TCAGCGACAC GGTGGGGGTG AAGCTGTCCC GTTTTTGGGG GAAACTGCTG 
CACCCGTTCC GAGCCGGACA GCGGCCGCCC CGGAACAGCG AGGAATTCTG GGCCCTGCGT 
GATGTTTCGT TCGAGGTGAA AGAAGGCGAG TGTGTCGGCA TCATCGGCGG CAACGGAGCC 
GGGAAATCCA CCCTGCTCAA GATCCTTAGC CGGATCACCG AACCCTCCAC CGGCCGCATC 
AGGATCAGAG GGAGGGTTGC AAGCCTGCTT GAGGTGGGAA CGGGTTTTCA CCCTGAACTG 
ACCGGGCGTG AGAACGTTTA CTTGAACGGG ACCATGCTTG GGATGACCCG CAGTGAGATC 
CGCAGCCGTT TCGACGAGAT CGTTGCATTC TCCGAAGTGG AGAGATTCCT CGATACCCCA 
GTGAAGCGGT ACTCCTCCGG CATGTACGTA CGCCTCGCCT TTGCGGTGGC TGCGCACCTT 
GAACCTGACA TCCTCATCGT GGACGAAGTC TTGTCGGTGG GGGATGCTCA ATTCCAGAAG 
AAGTGCCTTG GGAAAATGGA GGATGTATCA GCGAGGCAGG GCAGAACCGT ACTTTTCGTC 
AGCCACAACA TCCCTACCGT GCAAAGTCTC TGCAACCGGG GCATCCTGCT TCAAGGGGGG 
CGGGTAGCGT GTCAGGGTGA CATCAGAGGT GTGACTCAAA ACTACCTGCG CGGTTCCCTG 
CCCCAGTTAA CTACCGCAGC GGTTGAACTG CCTGGTGAGC ACCTGAAGAG GGTGCGCATC 
TGTGATGCCG AAGGTGAGCC CTGCACCCTT TTTCCCATGG GATCCCCCTT CAGGGTTGAG 
GTTGACAGCT GTGGTTTGGA TAGGGTTCCC GGTTCTCAGG TTAGCCTCTC CCTAAGGACC 
GAGGAAGGGG GACGTATTTT CACCCTCAAC ACCGGTATGA GTTGCCGGTA CTTAGCGCAG 
CAAAGGGGAG AACGGGAGAC CTTCATCCTG CAGGTGGACT GTCTGAACCT AGTACCCGGA 
CGTTACCTGC TAGAAGTATC CCTAGCCCAA AAGGGTGTGG CGAGGATGGA GCATTACGAG 
AATTTTGCCG AAATAACGGT CGTCGAACAT GATGTCTATG GGTCTGGCTA CATTCTCTCT 
AGCCATTACG GGCTGGTTTT CTTACAGGGG GGATGGAGCG TCAAGAATCA AGAGGAAGCC 
TTCAAGTGA

Protein sequence

MISVENIGKR YTISHRGSDS NHSISDTVGV KLSRFWGKLL HPFRAGQRPP RNSEEFWALR 
DVSFEVKEGE CVGIIGGNGA GKSTLLKILS RITEPSTGRI RIRGRVASLL EVGTGFHPEL 
TGRENVYLNG TMLGMTRSEI RSRFDEIVAF SEVERFLDTP VKRYSSGMYV RLAFAVAAHL 
EPDILIVDEV LSVGDAQFQK KCLGKMEDVS ARQGRTVLFV SHNIPTVQSL CNRGILLQGG 
RVACQGDIRG VTQNYLRGSL PQLTTAAVEL PGEHLKRVRI CDAEGEPCTL FPMGSPFRVE 
VDSCGLDRVP GSQVSLSLRT EEGGRIFTLN TGMSCRYLAQ QRGERETFIL QVDCLNLVPG 
RYLLEVSLAQ KGVARMEHYE NFAEITVVEH DVYGSGYILS SHYGLVFLQG GWSVKNQEEA 
FK