Gene Haur_3690 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Haur_3690
Symbol
ID	5735539
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Herpetosiphon aurantiacus ATCC 23779
Kingdom	Bacteria
Replicon accession	NC_009972
Strand	-
Start bp	4642417
End bp	4643742
Gene Length	1326 bp
Protein Length	441 aa
Translation table	11
GC content	49%
IMG OID	641280842
Product	putative esterase
Protein accession	YP_001546454
Protein GI	159900207
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG2382] Enterochelin esterase and related enzymes
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.0739014
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTGGTTGA CCTTAATCTT ATTTGTGGTT GGGCTGGGGC TGGCATTTGG CTTAGGAGTG 
ATGGTTGGCC GTCAACGCGG CTTCGCGCTA TTTTCTGCGC CTGAAGCTAC GCCATTGGTT 
AATTTTGAGT TTAAAATTCC TGCCGATACC GCGCCTGGTG ATCAACTGTA TCTGACTGGT 
TCGTTTAATC AGTGGCGACC GAATGATCCG ACCTATGTGC TTTCGCGCAG TGCCGATATT 
GCCTATGGCG CTTGGCCCTT TACCAATGGC TTGCGGCTTG ATTTCAAGTT AACCCGTGGT 
TCGTGGTCGA ATGTCGAAAA AGCCGCTGAT GGCAGCGAAA TGCCCAATCG AACTGGAATC 
GCCGCCAGCG GTGCGCAAGT TAAGGGTACA GTGGCGGCTT GGGCTGATCG TCAGCGTGAT 
GCAGCTAAAA TTTATGATGA GCGGGTTGAA CGGGTCGATT TTTTCAGCCA GGCTTTGGGA 
ATTACCCGCA CATTTTATAT TTATCTGCCA ATTGAAACTC GTAGCGATGA AAACCTGCGT 
GTACCCAGCC TCTATCTTTT CCGTGGTCAT GAACGCGAAT GGATCAATAA AACTGAAGAT 
GGGACGCGCG GTGGCAATCG CAATGTGATT GATGTCTACG AGGAATTACG TCGCCAAGAT 
CAGATTGGCC CGATGGTGAT GGTGTTTCCA GGCATGACCA ACGCCAATGA TGGGATTCAT 
AGCTTAGGCA TCAATCTCCA TTCACCAGAA TTAGTGGCTG ATCCTTCAAT TGGCACTGGC 
TTATTCGAAG ATTTTATCTA TCGCGATTTA ATTCCCTATG TCGAAACCCA TTATCCGGTG 
CTATTTGGCG GTGCGCATCG CTCGCTTGAT GGCTTTTCGT TGGGCGGCTT TATCAGTGTT 
AATCAAGCTT TGCGCCATCC CAACGAGTGG GCTTCGGTCG GGGCTTACGA TGGCTTATTC 
TTTTGGGACG ACCCTGAGAA TGCCGAAATT ATCGCTGCTC GTGATAGTGT TTTCGAACGT 
AATTTATTTG ATGCCAATTT TGGCGTGCCG CGCGACCATA CTTTTGCAGC CCAACATAAC 
CCATTGACCT TATTGCGAAT TGATGGAGCG CAGGCTTCAA AATTGCAATG GTTGATCGAA 
TATGGCCCTG AATCCGCCGA GCCCAATGTT AATTATTATC GTGGGGCACG GCTCGATGAG 
TTGCTGCGCG AAGTCGGGGC GCACAATCGG CTCAGCGGGG TTGTGCCAAA TGCCAATCAT 
TCATGGCAAA TGGCCGATGA ACATATGCGG CGCAGTTTAC CCTATCACTA TCAACAAACC 
CAATAA

Protein sequence

MWLTLILFVV GLGLAFGLGV MVGRQRGFAL FSAPEATPLV NFEFKIPADT APGDQLYLTG 
SFNQWRPNDP TYVLSRSADI AYGAWPFTNG LRLDFKLTRG SWSNVEKAAD GSEMPNRTGI 
AASGAQVKGT VAAWADRQRD AAKIYDERVE RVDFFSQALG ITRTFYIYLP IETRSDENLR 
VPSLYLFRGH EREWINKTED GTRGGNRNVI DVYEELRRQD QIGPMVMVFP GMTNANDGIH 
SLGINLHSPE LVADPSIGTG LFEDFIYRDL IPYVETHYPV LFGGAHRSLD GFSLGGFISV 
NQALRHPNEW ASVGAYDGLF FWDDPENAEI IAARDSVFER NLFDANFGVP RDHTFAAQHN 
PLTLLRIDGA QASKLQWLIE YGPESAEPNV NYYRGARLDE LLREVGAHNR LSGVVPNANH 
SWQMADEHMR RSLPYHYQQT Q