Gene Haur_4052 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Haur_4052
Symbol
ID	5735910
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Herpetosiphon aurantiacus ATCC 23779
Kingdom	Bacteria
Replicon accession	NC_009972
Strand	+
Start bp	5169883
End bp	5171010
Gene Length	1128 bp
Protein Length	375 aa
Translation table	11
GC content	54%
IMG OID	641281203
Product	patatin
Protein accession	YP_001546812
Protein GI	159900565
COG category	[R] General function prediction only
COG ID	[COG1752] Predicted esterase of the alpha-beta hydrolase superfamily
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCAAAAA AAGCTTTGGT GCTTTCCGGC GGCGGTGGCC GTGGAGCTTA TCACGTTGGG 
GTAATGCAAG CTTTGGTCGA ACGCGGCTGG ATGACCGATG GGCAAGGGCC AGATATTATT 
GCTGGCACTT CGATCGGCGC GGTCAACGGG GCGGCTTTGG CCTCAGGCAT GACTGTGGCT 
CAATTGCGCC AACGCTGGCT GCATATGCAC TCCGAAGATG TTCAGCAGCT TTCAAGCGAT 
CTGCCGTCGA TTAGCCGACC ACTGATGCGC TTTTTGCTGC GCTCGATTTT GACCTCTGAC 
GAGCATGGCG GCGATGATCA GATTGAGGCT GAAACGCCAG AGGCCGATCG CAATTTGCAT 
AGCCCCAGCA TTTGGCACAA ATTTCGCAGC ATTTTCAGCA CCACACCGTT TAAAAGTTTG 
CTTGATACCA CGCCATGGCG ACACACCCTC AGCGCTTGGA TGAACTTCGA GCGCATCAAT 
AGCCCCGCTG CGCCAACCCT GCTGTTGACC GCCACCGATG TTCGGCGCGG CACATTGCGG 
GTATTTTGCA ACCATAAACT TGATGGCCAA GCCCAAGATC AGCTCAACAT CGAGCATATT 
ATGGCTTCGT CGAGCATTCC AGCGGTCTAT CCATGGACTC AAGTTGGCGA AGATATGTAT 
TGGGATGGCG CGGTTTTGGC CAATACGCCG CTCGGTCCAG TCATTGAGCA TGCAGGCGGT 
GATGTTGAAA TTATTGTGGT GATGATGACC CCGTGGGATG CCGACCCCAA CGATGGCGAT 
CAACATCTTG AGGCCATGCC CAGCGATTTG GCGCAGTCGT TGTGGCTAAC GCTAGATTGG 
GCATTGTTGG CCTCCTATCG TGCATCATTT AAACTGCTCA AGGTATATAA CCAAATTGCT 
GAGGCGGCCC AACGCCTGAC CGCCGCCGCC GAAAAAACTG GCGATCAATC ACTGCGCTGG 
CCGGGCACGA TGCCTTATCG CGTAGCCGAG CCATTAGTGA TTGCGCCGCA AAAACTCATG 
CCCTTAGAAT GGATTGTCGA TTACGAGGGC AAAAATCATC AAGCTTTGTT TGAAATGGGC 
TATCGTGATG CCCTCCGTGC TTTCGATCAA CGCCAGGAGC AAGCGTGA

Protein sequence

MAKKALVLSG GGGRGAYHVG VMQALVERGW MTDGQGPDII AGTSIGAVNG AALASGMTVA 
QLRQRWLHMH SEDVQQLSSD LPSISRPLMR FLLRSILTSD EHGGDDQIEA ETPEADRNLH 
SPSIWHKFRS IFSTTPFKSL LDTTPWRHTL SAWMNFERIN SPAAPTLLLT ATDVRRGTLR 
VFCNHKLDGQ AQDQLNIEHI MASSSIPAVY PWTQVGEDMY WDGAVLANTP LGPVIEHAGG 
DVEIIVVMMT PWDADPNDGD QHLEAMPSDL AQSLWLTLDW ALLASYRASF KLLKVYNQIA 
EAAQRLTAAA EKTGDQSLRW PGTMPYRVAE PLVIAPQKLM PLEWIVDYEG KNHQALFEMG 
YRDALRAFDQ RQEQA