Gene GSU2201 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GSU2201
Symbol
ID	2686687
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sulfurreducens PCA
Kingdom	Bacteria
Replicon accession	NC_002939
Strand	+
Start bp	2414494
End bp	2415864
Gene Length	1371 bp
Protein Length	456 aa
Translation table	11
GC content	59%
IMG OID	637126894
Product	cytochrome c family protein
Protein accession	NP_953250
Protein GI	39997299
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.826403
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAGAATA CGACGTTCAT CGCCACCCTC ATGGCGAGCG TGGCAGTGGC GGCCCTGGTA 
CAGGCCAAGG ATCATCCGGG CAAGGAATAT ATCCAGAAAA ACGGCTACCA GGGGCCGGCA 
ACCTGCGAGG TCTGCCATCC CGGCGCGGCA AAGGAGTTCC TGAACTCCGT GCACTGGAAG 
CACGCCTCGA AGGTCGACAA CGTTGAGAAC ATTGACCCGA AGCAGGAATA CGGCATGAAA 
AACCGTATCT ACACCATGTG CAACGGGAAC GACATCGTCA ACAATCTGAA GGAGATTCCG 
CCCAGCCCCG AGACGGGCAA GACCAAGTAC TCGGGCTGCA ACTCCTGCCA TCCCGGGAAT 
CACATCCAGG ACGTGGGGAG CACCGGGCCC GAAGCGGAAG CCGCAGTGGA CTGCCTTGTC 
TGCCACTCCT CCACCTATGA TCACAGCAAG CGCAAGCCCT TCAAAGACGA GAAGGGGAAC 
GTGGTGCTCG GCCAGGATCG CAGCACCGAT GCGGCCCTTT CCATTGCCAC CCCGACGGTC 
AAGAACTGTA TGACCTGCCA CGAGGCTGCA GGGGGCGGCG TGCTGGTGAA GCGCGGGTTC 
GCCTTCAACA AGGAGCACGA TGTCCATGCG GCCAAGGGGA TGGTCTGCGT CGACTGCCAC 
AAGACGAAGA ACCACAAGAT CCCCACGGGC TACGATCCGA ACAACTGGGC CCATGACGGC 
GTACGTCTCT CCTGCACCGA CTGCCACACG GCAAAGCCCC ACAAGGACGA GGACTACAAC 
CGCCATACGG CGCGCATCGC CTGTCAGACC TGCCACATCC CCCGGACCGG CGGCGCCTTT 
GCCAAGGATT TCACGAAGTG GGAACAGCTC TCCAACAAGT TCTACGAGCC GACCACGCTC 
AAAAAAGAAG CAAATGAAAC GGCTCCCGTC TACGCATGGT ACAACCTGAC CGTGGCCAAC 
CGCCCTGACT TCATCGGGCC CAAGGGTGAC CGCAAGGACG GCAAGAGCAA GATCTACCCT 
TTCAAGATCT TCCAGGGCAA GGCGTACTTT AACAAGAAGG ACGGCCAGCT CCTGTCCATG 
GACTTCGCTC CGCCCATGGC AACGGGTGAC ACCCTCGCCG GCGTGGCATC AGCTGCCAAA 
ATCCTTGGGA TCAAGGATTA CGAACCGGTC CCCGGCTGGC AGACCATCTA CTTCGGCAGC 
AACCACCAGG TGGCTCCCAA GGAGAAGGCT CTTACCTGCT ATAACTGCCA TGCTCCCAAC 
GGCATTCTGA ACTTCCGCGA GCTCGGCTAT TCGTCCGACG AGGTCAAAAA GCTCACGAGC 
CCCGAACTCT ACTTTGAGAA AATCGCAGAG AAGATGCGGG AAGAGTGGTA A

Protein sequence

MKNTTFIATL MASVAVAALV QAKDHPGKEY IQKNGYQGPA TCEVCHPGAA KEFLNSVHWK 
HASKVDNVEN IDPKQEYGMK NRIYTMCNGN DIVNNLKEIP PSPETGKTKY SGCNSCHPGN 
HIQDVGSTGP EAEAAVDCLV CHSSTYDHSK RKPFKDEKGN VVLGQDRSTD AALSIATPTV 
KNCMTCHEAA GGGVLVKRGF AFNKEHDVHA AKGMVCVDCH KTKNHKIPTG YDPNNWAHDG 
VRLSCTDCHT AKPHKDEDYN RHTARIACQT CHIPRTGGAF AKDFTKWEQL SNKFYEPTTL 
KKEANETAPV YAWYNLTVAN RPDFIGPKGD RKDGKSKIYP FKIFQGKAYF NKKDGQLLSM 
DFAPPMATGD TLAGVASAAK ILGIKDYEPV PGWQTIYFGS NHQVAPKEKA LTCYNCHAPN 
GILNFRELGY SSDEVKKLTS PELYFEKIAE KMREEW