Gene GSU1788 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GSU1788
Symbol
ID	2686481
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sulfurreducens PCA
Kingdom	Bacteria
Replicon accession	NC_002939
Strand	-
Start bp	1951381
End bp	1952445
Gene Length	1065 bp
Protein Length	354 aa
Translation table	11
GC content	51%
IMG OID	637126468
Product	NHL repeat-containing protein
Protein accession	NP_952838
Protein GI	39996887
COG category	[S] Function unknown
COG ID	[COG3391] Uncharacterized conserved protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.565326
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGACTAA GCCGTGGCGT ATTCCTTCTT CTATTGTTGC TCGCGCTAGC ATCACCATTG 
ATGATCGTTG GGTGCGGCGG TCCGTCGTTC TTGCCCGCCG CCTCATTGCG AGACCCATCG 
GTGGATATGG CTTGGCCTCC TGCTCCTAAT CCGGCCCGGA TACGATTTCT TCGTGAAATT 
TCCGGGCCGG AGCAGGTTAA GGCTGAACCA GGAGCAATAG CCCGTTTTCT TGAGTTTGTT 
ACCGGCGAGC AGTTCAAGCA TGTTCCCTTT GTAACTCCCT ACGGGGTTGT CTCGGATGGC 
GGAACGCTTT TGTTTGTTTC CGATTCCTCG TCTGGTGTCG TTCATCGCAT CGATCTGGCG 
CGGCAAAAGG TTTCCTATAT TGTTCGGGCT GGCGATGAGT TCCTCTCAAG CCCGGTCGGA 
CTCGCCCTCT CCCCTTCAGG TGATCTGTAC GTCAGCGATT CGGTCAATGC CAAAGTGTAC 
GTTTTTTCCC GTGACGGAGA GTTTTTGCGT GTCCTGGCTG ATGGCCAGGT CGACTTCAAG 
AGACCGGCCG GTTTGGCCGT GAACAGTAAA GGCGTTCTTT TTGTTGTTGA TGTGTTGGCA 
CATAAATTGA AAGTTTTTAA CGTGAGTGGG CGTTTCTTGG GAGATTTCCC CCCTGATGAT 
ATTGGGGGTA AATTAAACCT TCCCTCCCAT GTGGCCGTTG ATAAGGACGA TAAAGTCTAT 
GTTACCGATG CCTTGAATTT TACGGTCAAG GTGTATGATT CAGCCCGTCG CTATCTCCGA 
AGTATCGGTG AAATAGGAGA TGCTCCCGGT TCTTTCGCGA GGCCCCGTGG CGTTGCAGTC 
GACAGTGACC TCAATGTGTA CGTGATCGAT GCCGCGTTTG ACAATTTTCA GATTTTTAAT 
CAGGAGGGGC AATTGCTCCT TTTCGTTGGA AAACCCGGCA AGAAAAGCGG TGAGTTTTAC 
ATGCCGAGCG GCATTCATAT CGATCGCAAC GATCGAATCT TCATCTCTGA TTCGTACAAC 
CGGCGGGTCC AGGTATTCGA ATACCTGAAA GAGGAAAATC GATGA

Protein sequence

MRLSRGVFLL LLLLALASPL MIVGCGGPSF LPAASLRDPS VDMAWPPAPN PARIRFLREI 
SGPEQVKAEP GAIARFLEFV TGEQFKHVPF VTPYGVVSDG GTLLFVSDSS SGVVHRIDLA 
RQKVSYIVRA GDEFLSSPVG LALSPSGDLY VSDSVNAKVY VFSRDGEFLR VLADGQVDFK 
RPAGLAVNSK GVLFVVDVLA HKLKVFNVSG RFLGDFPPDD IGGKLNLPSH VAVDKDDKVY 
VTDALNFTVK VYDSARRYLR SIGEIGDAPG SFARPRGVAV DSDLNVYVID AAFDNFQIFN 
QEGQLLLFVG KPGKKSGEFY MPSGIHIDRN DRIFISDSYN RRVQVFEYLK EENR