Gene Gmet_2017 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Gmet_2017
Symbol
ID	3740674
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter metallireducens GS-15
Kingdom	Bacteria
Replicon accession	NC_007517
Strand	-
Start bp	2256641
End bp	2257750
Gene Length	1110 bp
Protein Length	369 aa
Translation table	11
GC content	47%
IMG OID	637779311
Product	hypothetical protein
Protein accession	YP_384971
Protein GI	78223224
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG5653] Protein involved in cellulose biosynthesis (CelD)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	31
Plasmid unclonability p-value	0.555196
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	40
Fosmid unclonability p-value	0.0726848
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGTCAGCAG AATATTCTGT AGTTATCATC GACAATTTAA GCGGATTCAG CAGGATCCAA 
CAAGAATGGG ATGCGCTGGC TTCACAGTAC CACGACGAAT ATTTTTTCTT GAGTCATGGG 
TGGTATGGCC TGTGGCTGAA CTATTTCCTC AAAGGTAGCA GACTGTGCAT TGTAACCGTT 
TATAAAGGTG ACAGACTGGT CGCCATTGCG CCTTTCCTCG GCAAAGTAGA GAGAATCAAG 
AGAATACCGG TAAGGAAACT GGAGAGCATA GGCAATGCCT ATTCGCCCCT GAGATCTTTG 
ATAATTGACA GATCAGAGAG CAAGCAAAGG CTTGGTGAGT TTCTATTCCA GGCGTTAAGA 
AAGGTACCCG GCTGGGATAT CGCCCAGATT GGTCCGCTTT ACGATGGGGA ACTGTATTCC 
CAGGCTATGG ATCTGCTGCA TTATTCGGGA TGCAATTGGC TCCATAAAGC TGTTGACTGC 
AACTGGCGAC TCCCCTGTGA AGGTTTGGCC TATGAAGGGT ATCTGAAATG CAGGGACAAG 
GGTGTGCGGC AGGAGATTAA ACGAAGGAAT AAAAAGCTCG GGGAACTGGG CTCTATAGAA 
ATTAAGATAG TTAAAGGCCA TGAAGCTGCC GCGTATATGG CGGATTACAG CGACGTTTAT 
GAGAAAAGCT GGAAACAGGC CGAGCACCTG GGGCCCGGTT TTCATGTCGA TCTTGGAGAG 
ATTGCAGCGC GTGGCAACAA CTTGCTGCTG GCCTTGATGT ATCTTGATGG ACAACCCATA 
GCGGCGCAGT ATCGCATTTT GTGCGGAGAC AAATGTTTTT TTCTGAAGAC TGCCTATGAC 
TCACGTTATA AGCGGTACAG CGTGGGACTG GTTCTCCTTA ATCATGTATT GCAGTATTTG 
ATGGATAGCG AACAGGTCAA AATGGTGGAT TTTGGTCCCG GCAACGAAAC CTACAAGTCT 
GATTGGGCAG AAATTAAGGG GAATTACACC AATTTTTATC TGTTTAACAA AACCATCAAG 
GGCGTTTTGG CCCATTTTGC CTACACAAAA GTCAACCCGA TTGTGAAACG ATTTGGCAAA 
CGGCTTGAGG AAGAAGGGCA TGAAGGTTAG

Protein sequence

MSAEYSVVII DNLSGFSRIQ QEWDALASQY HDEYFFLSHG WYGLWLNYFL KGSRLCIVTV 
YKGDRLVAIA PFLGKVERIK RIPVRKLESI GNAYSPLRSL IIDRSESKQR LGEFLFQALR 
KVPGWDIAQI GPLYDGELYS QAMDLLHYSG CNWLHKAVDC NWRLPCEGLA YEGYLKCRDK 
GVRQEIKRRN KKLGELGSIE IKIVKGHEAA AYMADYSDVY EKSWKQAEHL GPGFHVDLGE 
IAARGNNLLL ALMYLDGQPI AAQYRILCGD KCFFLKTAYD SRYKRYSVGL VLLNHVLQYL 
MDSEQVKMVD FGPGNETYKS DWAEIKGNYT NFYLFNKTIK GVLAHFAYTK VNPIVKRFGK 
RLEEEGHEG