Gene GSU0302 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GSU0302
Symbol
ID	2686915
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sulfurreducens PCA
Kingdom	Bacteria
Replicon accession	NC_002939
Strand	+
Start bp	331170
End bp	333134
Gene Length	1965 bp
Protein Length	654 aa
Translation table	11
GC content	64%
IMG OID	637124968
Product	hypothetical protein
Protein accession	NP_951362
Protein GI	39995411
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCCCATC GCCTCCACCT GGAACAGTTC GGCCCCGTCC ATGCCCTCCC CGTTCTCCAC 
TATCGCCTGG AGTTCGCACA TCTCGTCCGC GAGGCAGTGC GCCGCGTCAA GCCCGACTGC 
ATCGCCATCG AGTTGCCGTC CACGATCGAG GCGCCGTTCC TGCGGGCAGT GGAGCGCCTG 
CCCGAGATAT CGGTCATCCA CTACGAAGGT CGGCAGCGCC GCGATGGCGC CGAATCGGTC 
TACCTCCTGG TGGAACCGGC CGATCCCCTG GTCGAAGGGG CGAGACTGGC CCTGGAGCGG 
CGGATTCCCC TGCGGCTCGT GGATGTGGAC ACCGACTCCT ATCCCCGCCA TGTGGAAGCG 
CTTCCCGACT CCTACGCCAT TCACCGGATT GGCCTCACCC CCTACTATGA GGAGTACCGG 
CGTGCGGCCG CCTCTGTGGC GCCGGGCCGG GAGGATCGGC GGCGCGAGCG GGGAATGGCC 
TGGCGGCTCC AGGAACTGGC AAAAGAGCAT GGCAGCATTC TCTTTGTCTG TGGCATGTAC 
CATCTGGAGC GGATCAAGGA CGATTTCGGG CGGCCCCAGG CCGCTCCCCT GGAGAGGGTG 
CGGCGCCAGG GGGTGAGGCT GTTCAATCTG CATCCCGACT CCTGCCGGGA GATCCTCGAC 
GAGTTTCCCT TTATTTCGGC GGTCCATGAA CTGCGTCGTG GTCCTCTGCC GCCTGAACCC 
GACGATCGCG GCGAGACGCT CCGCAAGCGA TTCAGTGCGT TCGAGCTAAT TGTCGGCGGG 
AGGAAGGACC TCCCGGCGGA GGAGCTTTTG CGCCATGCGG TAGAGCGGGG TGCCCGGCAT 
GCGGGGCGGG GGGAGGAGTT CCCCGACCGG CAGCGGATCA TCTTCCGGCT CTTCCAGGAG 
GCGGCCCGCC ACTACCGGCA GGAGACGGGC GACCCGGTCC ACCTCTGGCA GAAGCGGGCC 
TTTTTCCGTT TTGCCCGCAA TTATGCCCTT GCCTCGGGCG CACTCCTGCC CGATCTGTTT 
CAGCTGCTCA TGGCGGCACG GGGGTGTGTG GACGATAACT TCGCCTACGC CCTGTGGCGC 
CTTGCCACCT TCTACCACTG GCAGCGGGCC GAGGCAGACA TCCCGACCAT CAGTATCTCT 
CCCGAGGAAA TCTGGGGCGG GAGCCGCCGC ATCCGTTTCC GCCCACGGGA GCGGCGCCGG 
AAAGGGCTGT CGCATTTGGG CTTTCTCAAG CGCAAGAAGG AAAAGCGCCC CGGAGAATGG 
CTCGAAGGAT TCACTGACCC GAGCATCTGC TCCTATCCGC CCGAGGATGT GCTGATTGAG 
GAGTATGGCC GCTTTCTCAA GAAAAAAGGG GCCATGCAGC TTTCCGAGGA ACTCTCCCGT 
ACGGAGCCGT TCACCTCGTC ACTTCTGGAT GGGATCGATC TGCGGGAAAC ACTGCGCAAC 
GTTGCCGACG GGCGGGTCTA TGTTCGGGAA AGCCAGCGAG CCAAGGGGGG CGTGGGCTCG 
GTGGTCGTCA TCTTCGACGA AGACCGGGAA AACGGTAACT ATCCCTACCG CACGACCTGG 
CTGGGCGAGC ACGAGCAGGA ATCAGACATG GCCTTCTATG CGACGCCGCC GGAGGACAAC 
ATCGTCGGTC CCGGCATCTG CCGCTGCGAG TACGGCGGGT TTCTTCTCTC CTACCCGCCG 
CGCCGGATGA TGGATGTCTG GCGCGACCCG GACTATGTCT TTGCCCGGTC AAAGCCGGAG 
GTGCTTCTCC TGGCCGCTCT CGACTATTCG CCCGAAAAGC ATGTGGTCCA CGTGGCTGCC 
CGGCCACCCC GCAGCATCTT CCGGCAGATC GCCGCACGAA TGGGGAAAAA GATTGTCCAC 
ATCCCCTTGG GCTCCCTTTC GTCGGTAAAG CTCAAATCCA TCCGGGTGCT TCATATCCTG 
CACGGTCACG ACAAGCGTCA GGTGGCCAAG GACTACATCT GGTGA

Protein sequence

MPHRLHLEQF GPVHALPVLH YRLEFAHLVR EAVRRVKPDC IAIELPSTIE APFLRAVERL 
PEISVIHYEG RQRRDGAESV YLLVEPADPL VEGARLALER RIPLRLVDVD TDSYPRHVEA 
LPDSYAIHRI GLTPYYEEYR RAAASVAPGR EDRRRERGMA WRLQELAKEH GSILFVCGMY 
HLERIKDDFG RPQAAPLERV RRQGVRLFNL HPDSCREILD EFPFISAVHE LRRGPLPPEP 
DDRGETLRKR FSAFELIVGG RKDLPAEELL RHAVERGARH AGRGEEFPDR QRIIFRLFQE 
AARHYRQETG DPVHLWQKRA FFRFARNYAL ASGALLPDLF QLLMAARGCV DDNFAYALWR 
LATFYHWQRA EADIPTISIS PEEIWGGSRR IRFRPRERRR KGLSHLGFLK RKKEKRPGEW 
LEGFTDPSIC SYPPEDVLIE EYGRFLKKKG AMQLSEELSR TEPFTSSLLD GIDLRETLRN 
VADGRVYVRE SQRAKGGVGS VVVIFDEDRE NGNYPYRTTW LGEHEQESDM AFYATPPEDN 
IVGPGICRCE YGGFLLSYPP RRMMDVWRDP DYVFARSKPE VLLLAALDYS PEKHVVHVAA 
RPPRSIFRQI AARMGKKIVH IPLGSLSSVK LKSIRVLHIL HGHDKRQVAK DYIW