Gene Gmet_3529 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Gmet_3529
Symbol
ID	3739788
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter metallireducens GS-15
Kingdom	Bacteria
Replicon accession	NC_007517
Strand	+
Start bp	3962463
End bp	3963512
Gene Length	1050 bp
Protein Length	349 aa
Translation table	11
GC content	66%
IMG OID	637780818
Product	capsule biosynthesis protein, putative
Protein accession	YP_386459
Protein GI	78224712
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG2843] Putative enzyme of poly-gamma-glutamate biosynthesis (capsule formation)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	0.198641
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	73
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGCCAGG TCCGGCTTAT GCTTGCCGCC ATCGTCACCC TCCTTGCCGT CCCGGCCCTG 
GGCGCCGACG GAATCGTCAT CACCTGCGTC GGCGACATCA TGCTCGCCGG CAGCGCCACA 
CCGACCCTCT CCCGGTCGGG ATACGACTAC CCCTTCGCGA AGACGGCCCA GGAACTTCGG 
CGGGGCGATA TTGCCATGGG GAACCTGGAG GCCCCCCTTA CGGAGCGCGG AACCGAGTAC 
CGGGACAAAA CGTACCGTTT CCGGACAAAC CCCATCGCTG CAGCAGCCTT GAAGCGGGCC 
GGCTTCTCGG TCCTCACCCT GGCCAACAAC CACATGATGG ATTACGGAAA TGAGGGACTC 
CAGGACACCC TGGCGACCCT CTCCCGCCAC GGCATTGCCC ACACGGGCGC CGGCGCGTCA 
CTGGCCGAGG CCCGCCGGGA GGCGGTGGTC TCGGTGCGGG GGAAGCGGAT CGCCTTCCTC 
GCTTATTCCC TCACCTTTCC GTCGGAGTTC TATGCTGGCC CGAACCGGCC AGGCACCGCC 
CCCGGCTACG CCCCCCATGT ACGGGAGGAT ATCAGGCGGG CGAAGGCGGA GGCCGACTAC 
GTGGTGGTCT CGTTCCACTG GGGGGCGGAA CGGGCAGAGT TTCCGAAGCA GTACCAGACG 
GAGACTGCCC GATTGGCCAT TGATGCCGGC GCCGACGCCA TCATCGGCCA CCACCCCCAC 
GTGCTCCAGG GGATCGAATT CTACCGGGGA AAGCCGATTC TCTACAGCCT CGGCAACTTC 
GCCTTCGGCA GCCGGAGCAC CGCCGCCGAT CGGAGCGTCA TGGCACGGCT GACCCTCTCC 
GACGAAGAAA CCTCCGTGGA ACTGGTACCC CTGAACGTTC TGCACCGGGA GACCCGCTAC 
CAGCCCGGCA TCCTTGCGGG GCGCAAGGGA GCGGAGGTTA TCGAGCGGCT GAACCGGCTG 
TCGCAACCGT TCGGCACGGT GATTTCGGGT TCTGCGGGGC GCTTCAGGGC AAGAACATCC 
GGAGCCGACC AGCGCATCGC CACCCGCTGA

Protein sequence

MRQVRLMLAA IVTLLAVPAL GADGIVITCV GDIMLAGSAT PTLSRSGYDY PFAKTAQELR 
RGDIAMGNLE APLTERGTEY RDKTYRFRTN PIAAAALKRA GFSVLTLANN HMMDYGNEGL 
QDTLATLSRH GIAHTGAGAS LAEARREAVV SVRGKRIAFL AYSLTFPSEF YAGPNRPGTA 
PGYAPHVRED IRRAKAEADY VVVSFHWGAE RAEFPKQYQT ETARLAIDAG ADAIIGHHPH 
VLQGIEFYRG KPILYSLGNF AFGSRSTAAD RSVMARLTLS DEETSVELVP LNVLHRETRY 
QPGILAGRKG AEVIERLNRL SQPFGTVISG SAGRFRARTS GADQRIATR