Gene Haur_4024 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Haur_4024
Symbol
ID	5735885
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Herpetosiphon aurantiacus ATCC 23779
Kingdom	Bacteria
Replicon accession	NC_009972
Strand	+
Start bp	5135588
End bp	5137231
Gene Length	1644 bp
Protein Length	547 aa
Translation table	11
GC content	53%
IMG OID	641281174
Product	FAD dependent oxidoreductase
Protein accession	YP_001546784
Protein GI	159900537
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG1233] Phytoene dehydrogenase and related proteins
TIGRFAM ID	[TIGR02734] phytoene desaturase

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.411315
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCGCAAT TTGATGCGAT TGTGGTTGGC GGTGGGCATA ATGGCTTGAC CTGTGCCTGC 
TATTTGCAAA AGGCCGGAAT CAAAACCCTA GTGATCGAAC GACGAGCGAT CGTCGGCGGC 
GCAGTTTGCA CCGAAACCAT GTTTGGTGGC TATAAGATGG ATGTTGGCTC ATCGGCCCAC 
ATTATGATTC ACCTGACTCC TGTAGTGCGT GAGCTTGAAC TGCACAAATT TGGGCTTGAA 
TATATTGATA TGGACCCATT TGCTTGGTAT CCATTGCCCG ATGGCTCGGG GGCAATTGAA 
TTTTGGCGTG ATTTAGACAA GACGTGTGCT TCGATTGAGA AAATTTCACC CAAGGATGCC 
CATGCTTATC GCCAATTTGT GGCGTTGTGG GGGCCGCTCA ATGAAGGGGT TTTCGATGTA 
TTTCTCAAAG CACCTTCGCC TGCCAACTTA GGCCGCCAAA TGCTAACGGG CCAATTCAAA 
GGCGAAAAAG GCACGCATCC GCTGGATATT CTGCGGCGCT TGTTTACCTC GTATGGACAT 
TTGATCAACG AAACCTTTGA GAGCGAAGCA ATGCGGGCAG CAATGGGATG GCTAGCAGCG 
CAATCTGGCC CACCACCGCA CGAAATTGGC ACCGGCGATT TTGCGGGCTG GCACGCGATG 
CTGCATGAAA GTGGCGCGAA ACATCCGCGT GGTGGTTCGG GCATGTTGAC CCAAGCCATG 
GCGGCACGCT TCAAAAGTGA TGGCGGTACG CTGCTGCTTG ATGCCCCAGT TGAACGGATT 
GTGGTGCAAA ACGGCGTAGT GCACGGCGTA CAATTAACCT CGGGCGAAAC TTACACCGCA 
CCAACGGTTA TTTCCAATGC CCATGTGCAA ACCACCTTAT TAAAACTGGT TGAGCCTGAG 
CAACTGCCAA ATGGTCTGGT CGAGCGGGTT GGCCGCATTC GCGTTGGCAA TGGCTTTGGG 
ATGGCGGTGC GCTGTGCTGC CGATGAATTG CCCGATTATC TGGCTGCGCC TTCTGGTGGT 
CGCCCGCATC CTTCACATCA TGGGTTGCAA TTGCTTTGCC CTTCGATCGA CTACCTGAAT 
CGCGCGGTTA GCGATTATGA TCGCGGCGTG CCAGCGACCG ATCCAGCGGT AATTGCCATG 
ACATTTAGTG CAATCGACCC CGATGTTGCA CCCAAGGGCA AGCATACGCT GTTTTTGTGG 
GGTCAATATC ATCCGTATCA ATTAAGTAAT GGCGAAGATT GGGATAGCAT TGCCGAGCGC 
GAGGCCGACA AATTACTCGA AGTCGTGTAT CGTTATGCCC CCAATATGCG TGGCAAAATT 
AGCAACCGCT ATGTGCAAAC TCCCTTAACC TTGGAGCGCA CCTTTGGCAT GTTGCGTGGT 
AATGTGATGC ATGTCGAAAT GTCGTTCGAT CAGATGTTTG CCTTCCGCCC GCTGCCTGAG 
CTTTCCGAAT ACCGCGTGGC GGGAATTAAG GGCTTATATT TGACCGGAGC CAGCACCCAT 
CCTGGTGGCG GCGTATTTGC GGCCTCAGGT TACAACACCG CCCAAACCGT GCTCAAAGAT 
CAGCAGCCAT CACGTCAATG GGTTGGCTGG ACGCTCGGGG CGGCTGCCGC TTTAGGTGTG 
GTGGCTTGGG CCAAGAAGAA GTAA

Protein sequence

MAQFDAIVVG GGHNGLTCAC YLQKAGIKTL VIERRAIVGG AVCTETMFGG YKMDVGSSAH 
IMIHLTPVVR ELELHKFGLE YIDMDPFAWY PLPDGSGAIE FWRDLDKTCA SIEKISPKDA 
HAYRQFVALW GPLNEGVFDV FLKAPSPANL GRQMLTGQFK GEKGTHPLDI LRRLFTSYGH 
LINETFESEA MRAAMGWLAA QSGPPPHEIG TGDFAGWHAM LHESGAKHPR GGSGMLTQAM 
AARFKSDGGT LLLDAPVERI VVQNGVVHGV QLTSGETYTA PTVISNAHVQ TTLLKLVEPE 
QLPNGLVERV GRIRVGNGFG MAVRCAADEL PDYLAAPSGG RPHPSHHGLQ LLCPSIDYLN 
RAVSDYDRGV PATDPAVIAM TFSAIDPDVA PKGKHTLFLW GQYHPYQLSN GEDWDSIAER 
EADKLLEVVY RYAPNMRGKI SNRYVQTPLT LERTFGMLRG NVMHVEMSFD QMFAFRPLPE 
LSEYRVAGIK GLYLTGASTH PGGGVFAASG YNTAQTVLKD QQPSRQWVGW TLGAAAALGV 
VAWAKKK