Gene Tery_4067 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tery_4067
Symbol
ID	4242095
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Trichodesmium erythraeum IMS101
Kingdom	Bacteria
Replicon accession	NC_008312
Strand	-
Start bp	6279994
End bp	6281409
Gene Length	1416 bp
Protein Length	471 aa
Translation table	11
GC content	31%
IMG OID	638108970
Product	O-succinylbenzoic acid--CoA ligase
Protein accession	YP_723551
Protein GI	113477490
COG category	[I] Lipid transport and metabolism [Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG0318] Acyl-CoA synthetases (AMP-forming)/AMP-acid ligases II
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.846169
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	0
Fosmid unclonability p-value	0.0000722409
Fosmid Hitchhiker	No
Fosmid clonability	unclonable

Sequence

Gene sequence

ATGAACCTAA TCTTTAACTA CCTAAAAAAA TACCAAGTCA AAAGAAGTAA AACTTTTTTG 
AGCTCTAGCG AATTTTCTTA TCTTACGAAC AAAAAAATTA AAAACTTAAT CAAAATTGCA 
AATCCAAGAA CTCCTAGCAA AGTATTAATA TCAGAATCAA ATCCAACAGA ATTTATTTCT 
AGTTTTCTTG CTGCTGTTGG TGCTAATTGT CAAGTATTTT TATGTAATCC AAAATGGGGA 
CAACTAGAAT GGGAAAAAGT TTTAAAATTA GTAGAACCAG ACATGATTTT GGGAAATATT 
CTTAACCATA AATCTCTCGA AAAGTCTTTA GAAAAAATAT CTAGTTTGTC TAGAGATAAC 
CCCTGTAAAA AAACTCTGAC TACTGAGGAA AATTTGATTA TGATTCCTAC TGGTGGCTCA 
TCTGGCAAAA TTAAATTTGC TATTCATACA TGGGAAACTT TAATGTCATC TGTAAGAGGT 
TTCCAAGGAT ATTTCCAAGT ACAAGAAATT AATTCATTTT GTGTTTTACC CCTATATCAT 
GTCAGTGGTT TAATGCAGTT TATACGCTCC TTTACTACTG GGGGAAATTT AATAATTTTG 
CCATCCTATA AAGATATTTT AGAACAAAAA GAATGGAATA TTAACCCCAA TGAATTTTTC 
ATTTCCCTAG TACCAACTCA GTTACACCAT TTGTTACAAA AGGCAGAAAC AGCTAACTGG 
TTATCTAATT TTAAAATAGT GCTTTTAGGT GGTTCCGCAG CTTGGGAAGA ATTATTTGAT 
GCTGCAAGAA AATATCAAAT TAAATTAGCT CCAACTTATG GAATGACAGA AACTGCTTCT 
CAAGTTGCGA CTCTTAAACC ACAAGATTTT TTGGCAGGAA ATAATAGTAA CGGTCAAGTA 
TTACCTCACG CTAAAATTAT TGTGAAAAAT GAAAGTGGGA AAATATTATA TCAAAATCAA 
ATTGGTAATA TTAGCATTAA AGCTAATTCT TTGGCGTTAG GGTATTATCC TGATATATTT 
AATAATTATG AAAGTCTAGT AACAGATGAT TTAGGATTTT TTGATCATCA AGGTTACTTA 
AAAATAGTAG GTCGTAGTAG TCAAAAAATT ATTACTGGTG GGGAAAATGT TTTTCCGGCA 
GAAGTTGAAG CTGCTATTTT GACAACTGGT TTAGTTGATG ATATTTGTGT AATTGGCTTA 
GCAGATAAAT ATTGGGGTGA AGTTGTAACT GCTGTTTATG TGGGTAATTA TTTTGAAGTT 
TCTAAGGAAA AGTTGTTAGC TGCTATTGAT AAAAAATTGA GCAAATTTAA GCAGCCTAAA 
TATTGGCTAA GAGTAGAAAG TTTACCTCGT AATTCTCAAG GAAAAATTAA TCGAGAGTTT 
TTAAAAGAAA TTGCTATTCA AAGAATAGGA GAATAG

Protein sequence

MNLIFNYLKK YQVKRSKTFL SSSEFSYLTN KKIKNLIKIA NPRTPSKVLI SESNPTEFIS 
SFLAAVGANC QVFLCNPKWG QLEWEKVLKL VEPDMILGNI LNHKSLEKSL EKISSLSRDN 
PCKKTLTTEE NLIMIPTGGS SGKIKFAIHT WETLMSSVRG FQGYFQVQEI NSFCVLPLYH 
VSGLMQFIRS FTTGGNLIIL PSYKDILEQK EWNINPNEFF ISLVPTQLHH LLQKAETANW 
LSNFKIVLLG GSAAWEELFD AARKYQIKLA PTYGMTETAS QVATLKPQDF LAGNNSNGQV 
LPHAKIIVKN ESGKILYQNQ IGNISIKANS LALGYYPDIF NNYESLVTDD LGFFDHQGYL 
KIVGRSSQKI ITGGENVFPA EVEAAILTTG LVDDICVIGL ADKYWGEVVT AVYVGNYFEV 
SKEKLLAAID KKLSKFKQPK YWLRVESLPR NSQGKINREF LKEIAIQRIG E