Gene GM21_2449 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GM21_2449
Symbol
ID	8137790
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sp. M21
Kingdom	Bacteria
Replicon accession	NC_012918
Strand	+
Start bp	2856783
End bp	2857994
Gene Length	1212 bp
Protein Length	403 aa
Translation table	11
GC content	65%
IMG OID	644870059
Product	VanZ family protein
Protein accession	YP_003022250
Protein GI	253701061
COG category	[S] Function unknown
COG ID	[COG5652] Predicted integral membrane protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	168
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAAACGAA AATCGCTCTT TCCGGCCTTG GCCTGCGTCC TATTGATCGC CTACGCGTCT 
CTCTTCCCCC TAACCGGCTG GCGCCTACCC GGCGCCGGCT TTTTCGCCTG GTGCACCATT 
GAGCTTCCCG GCCGCGTCTC CAAGAGCGAC CTCCTCGTCA ACGTCATCGC CTACGTCCCT 
TTGGGCTACC TCCTTTTCCG CCTGTTCCGC CGGGATGACG GGCGCATCGC CGTTGCCTTT 
CTCTGCGCGC TCGCCGCCGG AAGCGCGCTC AGCTTCGCCA TGGAATTTAT CCAAGCCTTC 
CTCCCAAGCC GCACCCCCTC CGTCGTAGAC CTCTGCACCA ACACCCTGGG AACCTGCGCC 
GGCGCGCTCC TCGCGCTTTG CCGGCAGCAA GCGGCCGTGC CCGAAGGGGC CTGGTCCCGC 
TGGCGGGCGG GCTTTCTCAC AGCCGGTAGC CGGGGGGAGC TTGGCCTTTG CGTCCTTTTG 
CTCTGGCTTT GCTCCCAATG GGCACCCTTC GTCCCCTCGC TGGACTTAGG CGGCGTAAAG 
AACGGGCTCA AGCCCCTTTG GCAAACGGCG CGCGGACTGT CGCGCTTCGA CCTGGCGCAG 
GCCGCCACCT ACTTTTTCTA TTTAGCCGGG CTCGGGGTGG TGGCGCAGGA GACCTTCCGG 
CGGCGCGCCC TTGCCCTCCC CCTTTTCTCG TTTTTTGCGG CGGGCGTTCT CTGCGCCAAG 
ATCTTCATCC AGGGGCGACA GCTCTCCCTG GAGGCGTTAG CGGGGTTGTT AGCTGCTGTT 
CCGCTTCTGG TCGCGGCGGG GCTTATGGGG GAGAAGTCGA GAAGGGTTTT TTCGGGGTGC 
CTGCTGCTTA TCGCCGGTTT CGCCTTCTAC GAGTTGAAGC CGGGTGTGGG GAGTGTAGCG 
GGAGGGTTCA GTTGGATACC GCTGCAGGGG CAGTTGGCAC ACGAGCTGAG CGGCTTCGGG 
ACCATACTCG AAGGAGTGTG GCCTTTCGCG GCCATGGCGC TCCTGGTCGC GCCGGGGCGG 
GAAGAAGCGA GGGGTTCGTC CGCGCCGGGA GCGGCAGCCG TCTTTTGTTT CGTCTTCGCG 
CTGGAGTGGG TGCAGCTAGC GATCCCCGGC CGCACCCCCG ATCTGACCCA GGCGCTGTTG 
GCGCTCGCCG GTTGGCTCGC ACCGGCCTTC TATCTGCGAC AGGCGGAGCT GCGAGGTTGG 
ATTCGGACCT GA

Protein sequence

MKRKSLFPAL ACVLLIAYAS LFPLTGWRLP GAGFFAWCTI ELPGRVSKSD LLVNVIAYVP 
LGYLLFRLFR RDDGRIAVAF LCALAAGSAL SFAMEFIQAF LPSRTPSVVD LCTNTLGTCA 
GALLALCRQQ AAVPEGAWSR WRAGFLTAGS RGELGLCVLL LWLCSQWAPF VPSLDLGGVK 
NGLKPLWQTA RGLSRFDLAQ AATYFFYLAG LGVVAQETFR RRALALPLFS FFAAGVLCAK 
IFIQGRQLSL EALAGLLAAV PLLVAAGLMG EKSRRVFSGC LLLIAGFAFY ELKPGVGSVA 
GGFSWIPLQG QLAHELSGFG TILEGVWPFA AMALLVAPGR EEARGSSAPG AAAVFCFVFA 
LEWVQLAIPG RTPDLTQALL ALAGWLAPAF YLRQAELRGW IRT