Gene Haur_3571 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Haur_3571
Symbol
ID	5735430
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Herpetosiphon aurantiacus ATCC 23779
Kingdom	Bacteria
Replicon accession	NC_009972
Strand	-
Start bp	4490350
End bp	4491921
Gene Length	1572 bp
Protein Length	523 aa
Translation table	11
GC content	51%
IMG OID	641280718
Product	hypothetical protein
Protein accession	YP_001546335
Protein GI	159900088
COG category	[C] Energy production and conversion
COG ID	[COG1625] Fe-S oxidoreductase, related to NifB/MoaA family
TIGRFAM ID	[TIGR03279] putative FeS-containing Cyanobacterial-specific oxidoreductase

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.630428
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGAATATC AACCAAATCT TAGTAATATT CGACCAGGCA ATGGCGGGGT TATTCAAGCA 
GTCGCAGCAG GCAGTACTGG TGCGCAACTT GGGCTACAAG CTGGCGACGC AATTCTGCAA 
GTCAACGGTC GGGTGATGCG CGATGTGATT GATTTTCGCT TTGCCATGAC TGAAGATCAA 
GTTGAGTTGC TGGTGCGCCA AGCTGGCGAA GAACGTAGCA TCCAATTAAC CAAAAACCCC 
GATGATATGC TTGGCCTCGA TTTTGTCGAG CCATTATTTG ATCGCTTGCG AACCTGTAAT 
AATAAATGCC CCTTCTGCTT TCTGACCCAA ATGCCTAAAG GATTCCGCAA AACACTCTAC 
CTTAAGGACG ATGACTATCG CTTGTCGTTT TTGTATGGTA ACTTTGTAAC ATTGACGAAT 
CTCAAGGAGG AAGATTGGGA TCGGATTGCT GAACAACGCT TGGGGCCAAT GTATATTTCA 
GTCCATGCGA CTGATCGTAC CTTGCGGGCA ATTTTGTTGG GCAAGCCCGA TGTTCCCGAT 
GTGTTGGAGC AAATTCGACG CTTAGGCGAT TTGGGCATCG ATGTGCATAC CCAAGTGGTG 
GCCTGTCCAC AGTTGAATGA TGGCCCAGCC TTAGCCCAAA CCATCCATGA ATTGGGCCAG 
TTGTACCCAA TTGTTCAAAG CATCGCGATT GTGCCAGTTG GCCTGACCCG CTATCGCTTT 
GAGGGCAAGA AGCCCCAAAG CATCAAAGCT GCCATCCGTG TGCACGAAAG CGCCGAATGG 
ATTGATAGCA ACTGGGAAGC TCAGCCAATT TGGCAAGAAG AAGCGCCAGT TGCCAACGAA 
TTGTTTCAAG CGGCCAAGGA AGGAAATCTC GGCTTTTGTG CGCGGTTGGG GGCGGCCACC 
GAAGTCGAGT TGCGGCCATA TCGTGGCGAT GAAGCCGCTG CGGTGATCGA TATCTGCGAA 
CCATTTCAAG AATATTATAT GGCCGAACAT GGCTCGGTCT TAGTCTATCC CTCGGATGAG 
TTTTATCTGT TGGCGGGCCG CGAACAGCCC GATGGCTCGT TGTACGAAGG CTACGATCAA 
TTAGAGAATG GTGTGGGCTT GGTGCGCCAA TTCCAAGATG AATGGGCCGA GATTGTGCCT 
TCGCTGCCAA GTGCCGTCGA TAAACCCACC CGTATGTTGC TGGCTTGCGC AACGCTCGCC 
GCTCCCGTGT TGCAACAAGT CGCTGAACAA CTTAGTCGAA TTGAAAACCT GACCGTAGAA 
TTATGCCCAG TCGTCAATCA ATTTTTTGGC GAGATGGTAA CAGTTTCGGG TTTGCTGACT 
GGCGGCGATG TGGTCGCTGA GTTACAAAAG CATGGCCCCG CTGATATTGT GATGCTGCCG 
AAAGTGATGT TCGATCACTC CGGAACTCGT ACAATTGATG AATGGACTGT TGAACAAATT 
GCAACCGCAC TTGGTGCGCA GGTGACAATG GCACGGATGC CCCACGAAAT TCGCCGGGTC 
GTGCGTCAAC TCAGCCGCCA AGCTAAACCG CGCTCGCAGC GCCGGTATCT GGCTCAGGCT 
TCAATGCGCT AG

Protein sequence

MEYQPNLSNI RPGNGGVIQA VAAGSTGAQL GLQAGDAILQ VNGRVMRDVI DFRFAMTEDQ 
VELLVRQAGE ERSIQLTKNP DDMLGLDFVE PLFDRLRTCN NKCPFCFLTQ MPKGFRKTLY 
LKDDDYRLSF LYGNFVTLTN LKEEDWDRIA EQRLGPMYIS VHATDRTLRA ILLGKPDVPD 
VLEQIRRLGD LGIDVHTQVV ACPQLNDGPA LAQTIHELGQ LYPIVQSIAI VPVGLTRYRF 
EGKKPQSIKA AIRVHESAEW IDSNWEAQPI WQEEAPVANE LFQAAKEGNL GFCARLGAAT 
EVELRPYRGD EAAAVIDICE PFQEYYMAEH GSVLVYPSDE FYLLAGREQP DGSLYEGYDQ 
LENGVGLVRQ FQDEWAEIVP SLPSAVDKPT RMLLACATLA APVLQQVAEQ LSRIENLTVE 
LCPVVNQFFG EMVTVSGLLT GGDVVAELQK HGPADIVMLP KVMFDHSGTR TIDEWTVEQI 
ATALGAQVTM ARMPHEIRRV VRQLSRQAKP RSQRRYLAQA SMR