Gene GM21_1576 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GM21_1576
Symbol
ID	8136907
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sp. M21
Kingdom	Bacteria
Replicon accession	NC_012918
Strand	-
Start bp	1836625
End bp	1837635
Gene Length	1011 bp
Protein Length	336 aa
Translation table	11
GC content	61%
IMG OID	644869189
Product	TRAP dicarboxylate transporter, DctP subunit
Protein accession	YP_003021389
Protein GI	253700200
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1638] TRAP-type C4-dicarboxylate transport system, periplasmic component
TIGRFAM ID	[TIGR00787] tripartite ATP-independent periplasmic transporter solute receptor, DctP family

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	100
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTCTCA AAGCATGTCT GAAAGCATTG GCCATGGCAG CAGCGCTCGC CCTGCCGCTG 
AACGCCGTCG CGGCGCCGGC GCCGATCGTG ATCAAGTTCA GCCACGTCGT GGCGCAGCAC 
ACCCCCAAGG GGCAGGCTGC GGACTACTTC AAGAAACTGG CTGAAGAGCG GACCAAGGGA 
AGGGTCAAGG TCGAGGTGTA TCCGAACAGC CAGCTCTACA AGGACAAGGA AGAGATGGAA 
GCGCTGCAGC TCGGCGCGGT ACAGATGCTG GCGCCTTCCC TCGCCAAGTT CGCGCCGCTG 
GGCGTGAAGG AATTCGAGGT CTTCGACCTC CCCTTCATCT TCGACAACTA CCAGGAACTT 
CACAAGGTGA CCCAGGGGCC GGTCGGCGCG AAGCTCCTCA AAAAGCTCGA GCGCAAGGGT 
ATCCTCGGCC TCGCCTACTG GGACAACGGC TTCAAGGTGA TGAGCGCCAA CAAACCGCTT 
AAATCCGTAA ACGACTTCCG CGGTCAGAAG ATGCGCATCC AGTCCTCCAA GGTGCTCGAC 
TCCCAGATGC GTTCCGTAGG CGCCATGCCG CAGGTGCTCG CCTTCTCCGA GGTGTACCAG 
GCACTGCAGA CCGGCGTCGT CGACGGCACC GAGAACCCGC CGTCCAACCT CTACACCCAG 
AAGATGCACG AGGTGCAGAA ATACGTGACC CTCTCCGACC ACGGCTACCT GGGCTACGCC 
GTCATCGTCA ATAAGAAGTT CTGGCAGGGA CTGCCGGCCG ACATCCGCAC CATCCTGGAA 
GGGTGCATGA AGGACGCGAC CAAGTACGCC AACGACATCG CCAAGAAGGA CAACGAGGAG 
GCGCTTGCCG GCGTCAAGAA GTCCGGCCGC AGCCAGTTGA TCAGCCTCAC CCCGCAGGAG 
CGCACCGCCT GGAAGAAGGC GATGGACAAG GCGCACAAAA GTAACATGGG GCGCATCGGC 
GCCGACATAA TCAAGGAAGT CTACGCGGCC ACAGGCTACA ACCCGAACTA G

Protein sequence

MSLKACLKAL AMAAALALPL NAVAAPAPIV IKFSHVVAQH TPKGQAADYF KKLAEERTKG 
RVKVEVYPNS QLYKDKEEME ALQLGAVQML APSLAKFAPL GVKEFEVFDL PFIFDNYQEL 
HKVTQGPVGA KLLKKLERKG ILGLAYWDNG FKVMSANKPL KSVNDFRGQK MRIQSSKVLD 
SQMRSVGAMP QVLAFSEVYQ ALQTGVVDGT ENPPSNLYTQ KMHEVQKYVT LSDHGYLGYA 
VIVNKKFWQG LPADIRTILE GCMKDATKYA NDIAKKDNEE ALAGVKKSGR SQLISLTPQE 
RTAWKKAMDK AHKSNMGRIG ADIIKEVYAA TGYNPN