Gene Tery_4072 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tery_4072
Symbol
ID	4242100
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Trichodesmium erythraeum IMS101
Kingdom	Bacteria
Replicon accession	NC_008312
Strand	+
Start bp	6286709
End bp	6288205
Gene Length	1497 bp
Protein Length	498 aa
Translation table	11
GC content	32%
IMG OID	638108975
Product	isochorismate synthases
Protein accession	YP_723556
Protein GI	113477495
COG category	[H] Coenzyme transport and metabolism [Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG1169] Isochorismate synthase
TIGRFAM ID	[TIGR00543] isochorismate synthases

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.108156
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	0
Fosmid unclonability p-value	0.0000687043
Fosmid Hitchhiker	No
Fosmid clonability	unclonable

Sequence

Gene sequence

ATGCCTGTAA CACCAACTTC TGTTAATCTA TTTCAGACTT ACCAAGATCT GTATCAATTT 
CTGTTTAATT GTCAACAGAC ATTAACAGAC AATATGCAAA CAAAAATAAT TAGTATTTCT 
CGAGAAATAT TATCAGTAGA TCCCCTAGCA GTATTGCAAA AAATTTGTCA ACCACATCAA 
CTACATTTTT ATTTAGAAAA ACAAGCCATT GGAGAAAAAA ACATCCACAA AAATAGGTTG 
GCGATCGCTG CTGTAGATAC TGCTACCCAT TTTACTGTTA AAAGTGGGAG TCGTTTTGCG 
CAAGCTGAGT CTTTTATTCA ATCATGTTTA AACAATACAA TTTCTCTAGG TGCAACACAC 
TTACCATATT CAGGTCCCCA CTTTTTTTGT AGCTTTACTT TCTTTGAAAA AGATACTCAT 
GCCTATCTAC AAAACCTTTA TCAAAATGGT AATTACCAAC AAAAATTATC TCTAAACCTT 
CACTTTCCTT TAGCAACAAT ATTTCTACCA TGCTGGCAAA TAACTCAGAC AAATAAACAT 
AATATACTTG TAATTAATAC CGTTATTAAT AACTCTATTA ACATTAAAAA TCTTTCCCAT 
AAAATTTGGC ATAAATTCCA GGAAATAACC CAGATAAAAC ATAATCATTT ATCAACTTTA 
ACCAAGCCCA ATCAAAAACT TATAAAAATC AACGTCAATC ATTTACAAAA ATTTAAAAAA 
TCAGTAGCTT CAGCTCTAGA ATTAATCAAT TCAAATTATT TAAGAAAAAT TGTTTTAGCC 
CATGCTATAG ATATATATTC TCAAAATAAT TTCAACTTAA TCAAATCCTT AAACAACTTG 
CGATTCATTT ATCCAGACTG CTATGTATTT TCTATTAGTA ATGGCAAGGG CCAAAACTTC 
ATAGGTGCAA GTCCAGAACG CTTAATTAGT ATTAACAATA ATCAATTAGT TACAGATGCT 
TTAGCAGGTT CTGCACCTAG AGGCAAAACC CCTAGTCAAG ATGCTAAATT AGCCAATAGT 
TTATTATGTA GTGAAAAAGA TTTACGAGAA CATCAATTTG TCATAGATTT CATTATTAAA 
CGTCTTCAAT ATTTAGGATT AAAACCAAAT TATTTACCCC AACCAAATCT ACTACAATTG 
TCAAATATTC AGCATTTATG GACACCAATA AATGCAGAAG TTTCTCAAAA TATTCATTTA 
TTAGAAATAT TAGCACAACT CCATCCCACA CCAGCAGTGG CAGGAGTTCC TAGAGATATT 
GCTCAAGAAC AAATACAGAA TTTTGAAACT TTCGATCGCT CACTTTATGC AGCACCTATT 
GGTTGGATAG ATCACCAAGG AAATGGAGAA TTTACTGTAG GTATTAGGTC AGCTTTAATT 
GATGGAGAAC GCGCTAGACT TTATGCTGGT GCAGGTATAG TTACTGGTTC AAAACCAGAT 
CAAGAGTTAG CAGAAGTTCA ACTCAAACTT CAGACATTAT TAAAAGCTTT AGTTTAA

Protein sequence

MPVTPTSVNL FQTYQDLYQF LFNCQQTLTD NMQTKIISIS REILSVDPLA VLQKICQPHQ 
LHFYLEKQAI GEKNIHKNRL AIAAVDTATH FTVKSGSRFA QAESFIQSCL NNTISLGATH 
LPYSGPHFFC SFTFFEKDTH AYLQNLYQNG NYQQKLSLNL HFPLATIFLP CWQITQTNKH 
NILVINTVIN NSINIKNLSH KIWHKFQEIT QIKHNHLSTL TKPNQKLIKI NVNHLQKFKK 
SVASALELIN SNYLRKIVLA HAIDIYSQNN FNLIKSLNNL RFIYPDCYVF SISNGKGQNF 
IGASPERLIS INNNQLVTDA LAGSAPRGKT PSQDAKLANS LLCSEKDLRE HQFVIDFIIK 
RLQYLGLKPN YLPQPNLLQL SNIQHLWTPI NAEVSQNIHL LEILAQLHPT PAVAGVPRDI 
AQEQIQNFET FDRSLYAAPI GWIDHQGNGE FTVGIRSALI DGERARLYAG AGIVTGSKPD 
QELAEVQLKL QTLLKALV