Gene Tery_2866 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tery_2866
Symbol
ID	4244937
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Trichodesmium erythraeum IMS101
Kingdom	Bacteria
Replicon accession	NC_008312
Strand	-
Start bp	4469793
End bp	4470905
Gene Length	1113 bp
Protein Length	370 aa
Translation table	11
GC content	40%
IMG OID	638107915
Product	chorismate synthase
Protein accession	YP_722512
Protein GI	113476451
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0082] Chorismate synthase
TIGRFAM ID	[TIGR00033] chorismate synthase

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	6
Fosmid unclonability p-value	0.122087
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGCAACA TATTTGGACA TTTGTTTCGG GTAACAACCT TTGGTGAATC CCATGGGGGA 
GGAGTAGGAG TTATAATTGA TGGTTGCCCA CCAAAGCTAG AAATAAATGT TAAAGAAATT 
CAATATGAGT TAGATCGTAG GCGACCAGGG CAAAGCAAAA TTACTACACC CCGTAAAGAA 
AGTGATACTT GTGAAATACT GTCTGGGGTA TTTGAAGGTC AAACCTTGGG GACACCAATT 
ATGATTTGGG TCAGAAATAA GGATGCTCGT CCCCAAGATT ATCAAGATAT GGCTATTAAA 
TATCGTCCAT CTCATGCTGA TGCAACTTAT GATGCTAAAT ATGGTATCAG AAATTGGCAA 
GGTGGGGGAA GGTCTTCGGC CAGAGAGACA ATTGGACGAG TGGCTTCAGG AGCGATCGCT 
AAAAAAATTT TGCAACAATA TTCTGGTGTG GAAATTGTAG GCTATGTGAA GCGGATCAAA 
AATTTAGAAG CTATTGTTGA TCCAACAACG GTAACAATGG AACAAGTAGA AAGCAATATT 
GTTCGTTGTC CAGATAGTGA ATGTGCGGAG AAAATGATTG AATTAGTTGA AAAAATACGG 
GATTTGGGAG ATTCTGTGGG GGGTGTAGTA GAATGTATAG TCCGGAATGT GCCAAAAGGT 
TTGGGTTCTC CTGTATTTGA TAAACTAGAG GCTGATTTAG CCAAGGGTGT AATGTCTTTG 
CCAGCAACCA AAGGATTTGA AATTGGTTCT GGTTTTGCAG GTACTACTAT GACAGGTAGC 
GAGCATAATG ATGAACTCTA TACAGATAAA CTTGGTGAGA TTCGCACAGT GACAAATCGT 
TCTGGTGGAA TACAGGGTGG CATCTCTAAT GGAGAAAATA TTGTATTGCG CGTGGCATTT 
AAACCCACTG CAACAATAAG GAAAGAGCAG CGTACTGTTA GTCGTCAAGG TGAAGAGACA 
TTTCTTGCGG CTAAAGGAAG ACATGACCCT TGTGTTTTAC CTAGGGCTGT ACCTATGGTA 
GAAGCAATGG TAGCTATAGT TCTATGTGAT CATTTATTGC GTCATTATGG ACAATGTAAT 
ACCTTAAAGT CAGAAAATGT ATATGGAAAC TAA

Protein sequence

MGNIFGHLFR VTTFGESHGG GVGVIIDGCP PKLEINVKEI QYELDRRRPG QSKITTPRKE 
SDTCEILSGV FEGQTLGTPI MIWVRNKDAR PQDYQDMAIK YRPSHADATY DAKYGIRNWQ 
GGGRSSARET IGRVASGAIA KKILQQYSGV EIVGYVKRIK NLEAIVDPTT VTMEQVESNI 
VRCPDSECAE KMIELVEKIR DLGDSVGGVV ECIVRNVPKG LGSPVFDKLE ADLAKGVMSL 
PATKGFEIGS GFAGTTMTGS EHNDELYTDK LGEIRTVTNR SGGIQGGISN GENIVLRVAF 
KPTATIRKEQ RTVSRQGEET FLAAKGRHDP CVLPRAVPMV EAMVAIVLCD HLLRHYGQCN 
TLKSENVYGN