Gene Haur_3157 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Haur_3157
Symbol
ID	5735029
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Herpetosiphon aurantiacus ATCC 23779
Kingdom	Bacteria
Replicon accession	NC_009972
Strand	-
Start bp	3985844
End bp	3986671
Gene Length	828 bp
Protein Length	275 aa
Translation table	11
GC content	53%
IMG OID	641280300
Product	short-chain dehydrogenase/reductase SDR
Protein accession	YP_001545922
Protein GI	159899675
COG category	[I] Lipid transport and metabolism [Q] Secondary metabolites biosynthesis, transport and catabolism [R] General function prediction only
COG ID	[COG1028] Dehydrogenases with different specificities (related to short-chain alcohol dehydrogenases)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	4
Plasmid unclonability p-value	0.00132801
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCGTTAT TGGCCGAGAA AGTGGCGTTA ATTACTGGGG CTGGGCGTGG GATTGGAGCG 
GCGGCAGCGC GATTGTTTAG CCAACACGGG GCGCGGGTAG TCTTGTGCGA TTTGGATGCT 
GCGCCCGTTG AGCAATTAGC GGCTGAATTA AAAGCTGCTG GCGGCCAAGC CTTAGCGTTT 
GCTGGCGATG TGACCAGTGC TGAATTTGCG CCGCAAGCAA TTGCCGCCAC TTTGGAGCAC 
TTCGGCGGCT TAGATGTATT GGTCAACAAT GCTGGCTATA CGTGGGATGG CGTGTTGCAC 
ACCATGGATG ATGCCCAATG GCAAGCCATG CTCGATGTGC ATTTATCGGC TCCCTTTCGG 
CTGATTCGGG CAGCGGCTCC CTATTTGCGC GATACCGCCA AAGCCGAAAT TAAGGCTCAT 
GGCGCGGCCA AAGCCCGTAA AATTATCAAT GTTTCTTCGG TTTCGGGCGT GTATGGCAAT 
GCTGGGCAGG TCAATTATTC GGCGGCTAAA TCAGGTGTGA TTGGCCTAAC CAAAACTCTT 
GCCAAGGAAT GGGGCCGTTT TAATGTCCAA ACCAATGCGG TTTGCTATGG CTTTATTGAA 
ACTCGCTTGA CCGCTGCCAA AGAGCAGGGC GAGACGATTC AACGCGGCGA TCAGGCGATT 
AAACTTGGTG TGCCCGAAAA TCTCATGGCT GGAATTACCA TGTTTCATCC CATGGGGCGG 
GCTGGTACAC CGGAAGAAGC GGCTGGCCCG ATGGTCTTTT TAGCTTCGAG CTTGGCTAAT 
TATGTGAACG GCGAAATTCT CGAGGTAACT GGTGGTATGG GGATTTAG

Protein sequence

MALLAEKVAL ITGAGRGIGA AAARLFSQHG ARVVLCDLDA APVEQLAAEL KAAGGQALAF 
AGDVTSAEFA PQAIAATLEH FGGLDVLVNN AGYTWDGVLH TMDDAQWQAM LDVHLSAPFR 
LIRAAAPYLR DTAKAEIKAH GAAKARKIIN VSSVSGVYGN AGQVNYSAAK SGVIGLTKTL 
AKEWGRFNVQ TNAVCYGFIE TRLTAAKEQG ETIQRGDQAI KLGVPENLMA GITMFHPMGR 
AGTPEEAAGP MVFLASSLAN YVNGEILEVT GGMGI