Gene GSU0036 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GSU0036
Symbol
ID	2685741
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sulfurreducens PCA
Kingdom	Bacteria
Replicon accession	NC_002939
Strand	-
Start bp	46259
End bp	47314
Gene Length	1056 bp
Protein Length	351 aa
Translation table	11
GC content	64%
IMG OID	637124698
Product	capsule biosynthesis protein, putative
Protein accession	NP_951098
Protein GI	39995147
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG2843] Putative enzyme of poly-gamma-glutamate biosynthesis (capsule formation)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACCATCT TCCCCGCCGC ATTGACCCTA GTGCTCGTAC TGCTCGCAGT CCCTGCGGGG 
GCTCTCGCCG AGCGCATCAG CCTTTCTTTT GTGGGTGATG TGATGCTGGC CGGCAGCGCA 
ACTGACACCC TCCAGCGGTA CGGCTACAGC TATCCGTTTT CCGCTACCGC CGCAGAGCTG 
CGACGTAGCG ACCTGGTGGT GGGCAACCTG GAAGCCCCCC TCACCGACGG GGGGCGCGAG 
TTCCGCGCCA AACGTTTCCG CTTCAAGGCT TCTCCCGTCG CGGCAGCGGC CCTGAAACGG 
GCCGGCTTCT CGGTCATGAC ACTGGCCAAT AACCACATGA TGGACTTTGG CGCCGATGGG 
TTGAGCGACA CGATTCACCA TCTCAATCGT AACGGCATCG CCTTCGCAGG CGCTGGGCCG 
TCAATTGCTG ATGCCCGACG CGAAGCATCC GTGACGGTCA GGGGGCAGAC CGTCGCCTTC 
CTGGCCTACT CGCTCACCCA GCCGATCGAA TTCTTCGCCA CCGAGGGACG TCCTGGCACC 
GCACCCGGCT ACGCAGGCCA CTATCTCGCG GATATCCGAC GGGTCCGCAG CAGCGCCGAT 
CATGTGGTCG TCTCCTTCCA CTGGGGACAG GAGCGCGCCG CGCTACCATC GCCCTACCAG 
ATCGAAACAG CCCATCGCGC TATCGATGCA GGGGCTGACA TCGTCATCGG CCACCATCCC 
CATGTCCTCC AGGGAATCGA AATCTATCGC GGCAGCCCGA TCTTTTACAG CCTCGGTAAC 
TTTGCCTTCG GCAGCCGGAG CCCCTCGGCA GACCGGAGCA TCATCGCCCG GGTGACCCTC 
GGCGAAGGAC CGCCGATTGT GGAGGTCATC CCTCTCAACG TTCTTTTCCG CGAGGTACGC 
TTTCAACCGG CCATCCTCAC GGGCCGTAAG GCGGCGGACG TAGTGGACCG GCTGAATCGT 
CTGTCAGCCC CCTTTAGCAC GGTCATCACC TCCACCGCTG GCAGCCACCT CGTCGCGCCT 
GCGGAGGCTA ATGCCCGGCT TGCCCGCAGG CAGTGA

Protein sequence

MTIFPAALTL VLVLLAVPAG ALAERISLSF VGDVMLAGSA TDTLQRYGYS YPFSATAAEL 
RRSDLVVGNL EAPLTDGGRE FRAKRFRFKA SPVAAAALKR AGFSVMTLAN NHMMDFGADG 
LSDTIHHLNR NGIAFAGAGP SIADARREAS VTVRGQTVAF LAYSLTQPIE FFATEGRPGT 
APGYAGHYLA DIRRVRSSAD HVVVSFHWGQ ERAALPSPYQ IETAHRAIDA GADIVIGHHP 
HVLQGIEIYR GSPIFYSLGN FAFGSRSPSA DRSIIARVTL GEGPPIVEVI PLNVLFREVR 
FQPAILTGRK AADVVDRLNR LSAPFSTVIT STAGSHLVAP AEANARLARR Q