Gene Haur_3689 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Haur_3689
Symbol
ID	5735538
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Herpetosiphon aurantiacus ATCC 23779
Kingdom	Bacteria
Replicon accession	NC_009972
Strand	-
Start bp	4641038
End bp	4642402
Gene Length	1365 bp
Protein Length	454 aa
Translation table	11
GC content	53%
IMG OID	641280841
Product	cyclic nucleotide-binding protein
Protein accession	YP_001546453
Protein GI	159900206
COG category	[C] Energy production and conversion
COG ID	[COG1142] Fe-S-cluster-containing hydrogenase components 2
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.120597
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCTCCTC TCGCGCTCAA TCTCCAAGTT GATGCTTTGC AGAGCCTGCC CAATTTGGCC 
GAATTACCCA CCAACGAAGC CACAATTTTG GCGCGAATTG GGGTTTTTCG GGCTTTTGCG 
GCAGGCGACA CGATTCCGAT TGCCCGTTTA CGCAGTAGCC AATGCTATGT GATTTTGAGC 
GGCGTGGCTG ATACAGTGAT TCTTGATCGC GATGGTGAGC CGATTTCAAT TGGCGAGTTG 
GGCGAGGGCG ATTTTTTTGG CAATAGCATC TTTTTTAGCT CACATTCGCT GTTGTATGCC 
GTCCAAGCCC AAACCCAAAT CTTCGCGTTG CAATGGTCGA TTGAGCGTTT GCACGAAAAA 
AAGCAACATC TGCCACTATT TATGCGTTTG CTCGAAGCGA GCTATTTGCA ACGCCGCGCG 
GTTAGTGCCC TGAGCCGTGT GCCGTTGTTT AGTCATGTCA GCGTTGAAGA ACGGGCCTTG 
TTGGCAACCC AACTCACGCG CCAAGAATTT GGCCGTAACA CCGTGATTTT TGAGCAAGGC 
TCGGCTGGCC AAGCCTTATA TTTGATCGAA CAAGGCCAAA TTGCCGTTGA GCAACATGGC 
GTGATTGTAG CAACCCTCAG CGATGGTGAT TTTTTTGGCG AGATGGCTTT GCTCTCGGCA 
ACACCGCACA ATGCCACCTT ACGTTGTCTA ACCCCAACCC GCTGCTTGCA CCTGCCGGGT 
GCGGTTTTTG CGGCCCAAGT TGCCCAACAT CCTTCGCTTG AAGCGGCGGT ACGGCGGGTG 
ATCGATGAAC GGGTGCATCA CTCGGAGCGA GTACGCGGCG ACCAAACTCG TCAGCATTTG 
ATCAAAGTGG CGGTGCGCTA TGGCATGTTT CGTGGCTCGC ATGTGTTGGT GCGCCAGCCC 
GCGCAATGCC CGCCCGATTG CCGAATTTGT GAGCAGGCTT GTGCTGAGCG TTTTGGCCAA 
ACCCGTATGC GGCTCAACGG CGCTAAAATC GAAGATTGGG ATATTACTCA GAGTTGTCGG 
CAGTGTCGAG TTGGAGCCGA GTGCGTTGAG GCATGTCCCG AAGCTGCGAT TCAATGGGAT 
GATAATGGGG CGTTACGGAT TACTGATGCT TGCACTGGTT GCAACGAGTG TGTGCTGGCC 
TGCCCTTATG ATGCGGTTGA ATCGCAAACG ATCTTTTTAC AGAACCAGCA AGGGCCACTT 
TGGCAGCTTT GGCAGCGGAT GCGCCAGCAA TCACATCAAA TTCAGCCCAA AACCGTGGCT 
AGTAAATGCG ATTTATGCGC AGGCTATGAT GATCGGGCTT GTTTGAGCCA ATGCCCAACT 
GGCTCGTTGC AATTAATCTC AATCGAAGAG CTATTTCCCT TTTGA

Protein sequence

MAPLALNLQV DALQSLPNLA ELPTNEATIL ARIGVFRAFA AGDTIPIARL RSSQCYVILS 
GVADTVILDR DGEPISIGEL GEGDFFGNSI FFSSHSLLYA VQAQTQIFAL QWSIERLHEK 
KQHLPLFMRL LEASYLQRRA VSALSRVPLF SHVSVEERAL LATQLTRQEF GRNTVIFEQG 
SAGQALYLIE QGQIAVEQHG VIVATLSDGD FFGEMALLSA TPHNATLRCL TPTRCLHLPG 
AVFAAQVAQH PSLEAAVRRV IDERVHHSER VRGDQTRQHL IKVAVRYGMF RGSHVLVRQP 
AQCPPDCRIC EQACAERFGQ TRMRLNGAKI EDWDITQSCR QCRVGAECVE ACPEAAIQWD 
DNGALRITDA CTGCNECVLA CPYDAVESQT IFLQNQQGPL WQLWQRMRQQ SHQIQPKTVA 
SKCDLCAGYD DRACLSQCPT GSLQLISIEE LFPF