Gene Haur_2030 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Haur_2030
Symbol
ID	5733919
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Herpetosiphon aurantiacus ATCC 23779
Kingdom	Bacteria
Replicon accession	NC_009972
Strand	-
Start bp	2525082
End bp	2526734
Gene Length	1653 bp
Protein Length	550 aa
Translation table	11
GC content	50%
IMG OID	641279174
Product	amino acid adenylation domain-containing protein
Protein accession	YP_001544801
Protein GI	159898554
COG category	[I] Lipid transport and metabolism [Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG0318] Acyl-CoA synthetases (AMP-forming)/AMP-acid ligases II
TIGRFAM ID	[TIGR01733] amino acid adenylation domain

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATGATTG AGTTTAACCA GATGCTTGAA GTTGTGCCTC CATGCCAAAG CGAGCCAAAC 
CAAGCACACG CAACCAGCCA ATTGCACAGC GGTTTTCTAC AGAGCGTCCA GCGCTATCCA 
AATAACATCG CTTTAACGAT TGGTAATAAA CAGTATGATT ATGTCAAATT ATATACAGTT 
GCCCAACGCT GGGCTTTCGC GCTTCGCCAA TCAACCAAAC CGCTGCATCG TGTTGGTATT 
TTTGCCTATC GTAGTGAAGC AGCCTACATC GGGATTTTGG CAAGCTTATT GGCTGGCGCA 
ACCTTTGTGC CGCTGAACTA CAACTTTCCA CTTCAACGGA CCCAAGCGAT GATCGAGCAA 
GCAGAGCTTG ATGCGATTAT TGTCGATCAC CAATCGTATG ACCAATTTTT GCAATTGGCC 
GATTCGCTGC CAGTACTACC GCCATGTGTC CTCTTGCCTG ATTGTTTGCG TGCGCCGCTG 
CTTGATACAA TGATCTATAC TCAAGCCGAG CTTGCTGAGC TACCGACTGA TCATGAACCA 
GTTACTGTGC CGCCTGAGGC AATTGCCTAT CTGTTATTCA CTTCGGGTAG CACCGGCAAC 
CCCAAAGGCG TACCAATTAG TCATGCCAAT GTCGCACACT TTCTCAAGGT AAATCAAGCA 
CGATATCAGA TTACGCCTGC TGATCGGCTG AGCCAGACCT TTGATCAAAC CTTTGATCTG 
GCCATCTTTG ATCTTTTTAT GGCTTGGAAT CATGGTGCGG CGGTCTGTGT TATCCAACCG 
ATCCAATTGC TCTCACCTTT TCGCTTAATT GAAGAGCAGG GAATTACGAT TTGGTTTTCG 
GTACCATCAG TTGCCGCGTT ACTGCGCAAA CAAAAACTAC TCAAGCCCAA TAGCTTGCCC 
AACTTACGCT TAAGCCTTTT TTGTGGCGAA GCGTTGCCCA AAGCTACCGC TGAGGCTTGG 
CAACTTGCTG CGCCCAACTC AATAATCGAC AATCTCTATG GTCCAACCGA ATTAACAATC 
GCCTGTGCAG TGTATCGCTG GAATTCCCTC ACCTCGCCTG CTGAATGTTT GAATGAAGTG 
GTCCCAATTG GTAAACTCTA CCCAGGTTTA ACCGCGGTGG TGGTTGACGC AAACGATAAT 
CCTGTACCAG CAGGTACAGA AGGCGAATTG TGTGTTGCTG GCCCACAAAC CTTCCAAGGC 
TATTGGCACA ACCCAAGCCT CACGGAGCAA CGGTTTCTGC GCAGCAAACA GCTTAATGGC 
GAGGAACTCG GCTACTACCG CACCGGTGAT CGGGTTGTAT GCCGCACCAA TGGCAGCATG 
ATTTACCTTG GGCGCAGCGA TCAACAAATT AAAGTCCATG GCTACCGGGT GGAATTAAGC 
GAGATTGAAG GGGCGTTATT ACTCCAACCA GGCGTAGTTG CTGCGGTTGC ACTGGGCTGG 
CCGCTTGAAA ACGGTTCGGC GAGCGGAATT GTCGCGTTTG TAATTGCGCC AAGCATTGCA 
GTCAGTGATC TGCAACAGGC GGTTCAGCCA TTGCTCCCAA GCTATATGCT GCCGCGCACC 
ATCTATCAGC TTGAAACCAT GCCGCTGAAT GCCAATGGCA AAATTGATCG GTTGGCCTTG 
GCTCGCCACT TAGCAGGTGA AGGAACGGCC TAA

Protein sequence

MMIEFNQMLE VVPPCQSEPN QAHATSQLHS GFLQSVQRYP NNIALTIGNK QYDYVKLYTV 
AQRWAFALRQ STKPLHRVGI FAYRSEAAYI GILASLLAGA TFVPLNYNFP LQRTQAMIEQ 
AELDAIIVDH QSYDQFLQLA DSLPVLPPCV LLPDCLRAPL LDTMIYTQAE LAELPTDHEP 
VTVPPEAIAY LLFTSGSTGN PKGVPISHAN VAHFLKVNQA RYQITPADRL SQTFDQTFDL 
AIFDLFMAWN HGAAVCVIQP IQLLSPFRLI EEQGITIWFS VPSVAALLRK QKLLKPNSLP 
NLRLSLFCGE ALPKATAEAW QLAAPNSIID NLYGPTELTI ACAVYRWNSL TSPAECLNEV 
VPIGKLYPGL TAVVVDANDN PVPAGTEGEL CVAGPQTFQG YWHNPSLTEQ RFLRSKQLNG 
EELGYYRTGD RVVCRTNGSM IYLGRSDQQI KVHGYRVELS EIEGALLLQP GVVAAVALGW 
PLENGSASGI VAFVIAPSIA VSDLQQAVQP LLPSYMLPRT IYQLETMPLN ANGKIDRLAL 
ARHLAGEGTA