Gene GM21_1853 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GM21_1853
Symbol
ID	8137184
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sp. M21
Kingdom	Bacteria
Replicon accession	NC_012918
Strand	+
Start bp	2155962
End bp	2156948
Gene Length	987 bp
Protein Length	328 aa
Translation table	11
GC content	64%
IMG OID	644869464
Product	TRAP transporter solute receptor, TAXI family
Protein accession	YP_003021664
Protein GI	253700475
COG category	[R] General function prediction only
COG ID	[COG2358] TRAP-type uncharacterized transport system, periplasmic component
TIGRFAM ID	[TIGR02122] TRAP transporter solute receptor, TAXI family

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	71
Fosmid unclonability p-value	0.45766
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCCGGC ACCGGCGTTA CCCGCGCTTA CTGGCGCTCC TTGTGACAGT CACCGTCCTG 
TTCGTCCCCT GTTCTCTCAC CGCCTTTCAG TATCCCTCAC TCACCATCTC CTCCGGGACC 
ACCACCGGTT CCTATTATGC CGCCGCCAGT GCCATAGCGA AGGTGTTCAA CCCCAGCAGC 
GGCCGCAACG GCGTGAGGCT CGCCACGGTC GCCTCGCCCG GGTCGGTGGC CAACATCGAC 
CAGGTCGCCG ACGGCAAGGC CGCCTTCGGC ATCGCCGAGA CGGAGCTTTT GAAGCGGGCC 
ACGCTGGGGG TGCGACCCTG GGAAGGGAAG GCGCGCACCG GCCTGCGCGC GATATTTAGC 
ATCTACGTCG AGAGCGTCAC CGTCGTCGCC GCGGTCGACA GCGGCATCAA GCGGGTGAGC 
GACCTGAAGG GGAAGCGGCT GAATATCGGC GCGCCTGGCT CGATAGACAA CACCTATGCG 
GCCGCTTTCC TGCAGATGTC CGGGCTGAAC CCTGGGCTGG TGGTCACCTC GCAGCACTCA 
ACCGCGATCG CGCCCGAACT GTTGCAAAAA GGAGAGATCG ACGCCTACCT CTGCATCGTC 
GGCCATCCGA ACCTGACCGT GCTGGAAGCG AGCGCAGGCA AGCGCAAGGT CACCTTGATA 
TCCCTGGACA ACGCCCTGAT CCAGCAGGTG GTCGGCCACA ACCCGCTGCT GATGGCCGTC 
GCCATACCCA CCAACTTCTA TCCCAGAGTC GAAGTCAGCG GCAAGGTCCC CACCATCGGC 
CTGCGCGCCG TTCTCTTCAC CTCGGCCGAT CAGCCCGAGG AAATCGTGTA CGCGGTGGTG 
CGGGAGGTCA TGTCCAACCT CGACCTGTTC CGCCGCCAGC ATCCCATCCT GCAGAATCTC 
TCCCCGCGGG ACGCCGCAAA GGTCGGGGCC ATTGCGCTTC ACCCCGGCGC CCTCCGATAT 
TTCAAAGAGG CAGGCCTCGT TCCCTGA

Protein sequence

MTRHRRYPRL LALLVTVTVL FVPCSLTAFQ YPSLTISSGT TTGSYYAAAS AIAKVFNPSS 
GRNGVRLATV ASPGSVANID QVADGKAAFG IAETELLKRA TLGVRPWEGK ARTGLRAIFS 
IYVESVTVVA AVDSGIKRVS DLKGKRLNIG APGSIDNTYA AAFLQMSGLN PGLVVTSQHS 
TAIAPELLQK GEIDAYLCIV GHPNLTVLEA SAGKRKVTLI SLDNALIQQV VGHNPLLMAV 
AIPTNFYPRV EVSGKVPTIG LRAVLFTSAD QPEEIVYAVV REVMSNLDLF RRQHPILQNL 
SPRDAAKVGA IALHPGALRY FKEAGLVP