Gene Haur_3909 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Haur_3909
Symbol
ID	5735770
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Herpetosiphon aurantiacus ATCC 23779
Kingdom	Bacteria
Replicon accession	NC_009972
Strand	+
Start bp	4899285
End bp	4901336
Gene Length	2052 bp
Protein Length	683 aa
Translation table	11
GC content	51%
IMG OID	641281060
Product	hypothetical protein
Protein accession	YP_001546671
Protein GI	159900424
COG category	[C] Energy production and conversion
COG ID	[COG0644] Dehydrogenases (flavoproteins)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCACGTTT ACGCTCGTAT CGATATTGAA TGGTCGGCAG CACCAGCCCT CATCCACGCT 
AGCCTCGCTG CTCGACAAGG TTGGTTGTTG GGAGCTGTTA TCGCTGATCG CTGGCTTTGG 
GCTGATCAAA CTTGGCAGAT TACTCCAAAC CATAGCTCGC AACGCTTGCA TTGGCAAGCA 
CAGAGCATCA CGCAACCAAG CCTCAAAGCC GATTTGCTGC TCGAATTGCT GGATAGTGTT 
TCCAGCACTC ACGTTCGGGC CACCTTGCAT GTTGAATGGC CTAAAACCAC GTTTAAATTA 
TGGCGCTATT GGCAACGCCG TCGCTGGTTA CACAACGAAT TAACCAACGT TTTGCAACAT 
TGGCGCGACG CTTGGACAAC CCAATCCACG CCAAGCGACC AACTTGCCCA AAGCCATCCG 
CGCACATGGC AAGCTTTCCA CACCATGAAT GCGCTCGATC AACTCCAACG GATTCAAGCA 
CTCGATCGAC GTTGGCAGCA ATTTGAGCAT GGCCAACTGC CCAACTTGCC CTATAGCCAG 
ACCGATCAAT TGCCCAAGGC TGATCTGGCG GTCGATTTGG TCTATGCTGG CGGCGGCTTG 
GGCTTGATTC ATGCCACGCT GATGGCTCGC AAAGGGCTAA ATGTGCTGGT GTTTGATCGG 
CATCAGGTTG GTTGCGCTCA TCGCGAATGG AATATTTCGC AGGCTGAACT TGAACGCTTA 
GTAGCAACTG GCTTTATCTC GTGGGAAATC CTCGAACGCC AGATTATTAT GGCGCGTTAC 
CACGATGGGA TTGTGCGCTT TCACGCGGCT GGCTCTGCCG TTGCTCCTGC CGAATTACAC 
TTACCCGAAG TATTAGATAT TGCGCTCGAT GCTGGTGCGT TGCTCGATTA TGCCCGCCAA 
CAGTTTCTGG CTGCAGGCGG CATTATTTGG GATAACACCA GTTTTGAGCA TGTCTATCAC 
GATCCAAAGC AGCAACAAAC TGTCGTAGCC GTGCACAAAG CAGATCAAAC GCAACTGATA 
GCTGCCCGTT TGCTGATCGA TGCTATGGGT GCAACCTCGC CATTAACCCT GGCAACCCAA 
CCATTTGCTG GCATCTGTCC AACCGTTGGC ACGGTGCTTA GTGGCGCGGA GCATGACCAA 
AACTTGGGCG ATATTTTGAT CAGCATTGCC GATACCCAAG CTGATCGCCA ACTGATTTGG 
GAAGGCTTTC CAGGCCGTGA GCATGAACTG ACGGTCTATG TGTTTTACTA TGATCAGGTT 
GGAGCCAAAG CCAAATATCG CCATTCGCTG CTGGATTTAT TTGAAGATTA CTTTGAACTC 
TTGCCAAGTT ATAAGCAGCT TCAAGCGAAT GCTCAGCATC TCCGTCCGGT TTTTGGCTAT 
ATTCCAGCGC GTCATGCCTT GAACAAACCT AAACCTTTGG CAGGCGTTTT GGCTTTGGGC 
GATGCCTCAG CCCAACAATC GCCGTTGACA TTTTGTGGCT TCGGCTCGTT TGTCCGCAAC 
TTAAGCCGTA CCACCGATTT GCTCGAACAA GCACTTGAAC AAGCGTTGCT TGCCCCTCAG 
CAGCTTAGTT TGATTAGCGC CTATCAAAGC AATGTCAGCA TGAATTGGGT ATTTAGCCGT 
TTTATGACTC CATGGGGTCG CCCGCAAGAT GTCAATGAGC TGCAAAATGT CTTTGCTCAT 
GTGCTCAATC GCTTGGGATA CGACCTCGCA CGGCGCTTTT TCCAAGATCA AATGACTTGG 
CACGATTATA ATCGGGTCGT CTTAGGCACG CTGGCCTTCT ACCCACGGAT TATGCAAGTT 
GCTTGGCAAG TGCTTGGTTG GCGCGATTGG CTGCGCTGGA TTGGCGATTG GCTGCGATTT 
AGCCGCGCAG CATTCATTGC CCAGTTTGGT CAACAATTAC CAAGTTGGTT GGTTGGCCGC 
TTGCCTAAAC CATGGCTTTT TCAGTACAAT GCAGCCTATG CCGAATGGCG AGCGATGGGT 
TGGCTCAAAT CTAGCCCTGA GCATCAAAGC CAAGCGCTTG GTTCACAACC CTCAATCAAG 
CAATTTGGCT AG

Protein sequence

MHVYARIDIE WSAAPALIHA SLAARQGWLL GAVIADRWLW ADQTWQITPN HSSQRLHWQA 
QSITQPSLKA DLLLELLDSV SSTHVRATLH VEWPKTTFKL WRYWQRRRWL HNELTNVLQH 
WRDAWTTQST PSDQLAQSHP RTWQAFHTMN ALDQLQRIQA LDRRWQQFEH GQLPNLPYSQ 
TDQLPKADLA VDLVYAGGGL GLIHATLMAR KGLNVLVFDR HQVGCAHREW NISQAELERL 
VATGFISWEI LERQIIMARY HDGIVRFHAA GSAVAPAELH LPEVLDIALD AGALLDYARQ 
QFLAAGGIIW DNTSFEHVYH DPKQQQTVVA VHKADQTQLI AARLLIDAMG ATSPLTLATQ 
PFAGICPTVG TVLSGAEHDQ NLGDILISIA DTQADRQLIW EGFPGREHEL TVYVFYYDQV 
GAKAKYRHSL LDLFEDYFEL LPSYKQLQAN AQHLRPVFGY IPARHALNKP KPLAGVLALG 
DASAQQSPLT FCGFGSFVRN LSRTTDLLEQ ALEQALLAPQ QLSLISAYQS NVSMNWVFSR 
FMTPWGRPQD VNELQNVFAH VLNRLGYDLA RRFFQDQMTW HDYNRVVLGT LAFYPRIMQV 
AWQVLGWRDW LRWIGDWLRF SRAAFIAQFG QQLPSWLVGR LPKPWLFQYN AAYAEWRAMG 
WLKSSPEHQS QALGSQPSIK QFG