Gene Tery_3607 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tery_3607
Symbol
ID	4244240
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Trichodesmium erythraeum IMS101
Kingdom	Bacteria
Replicon accession	NC_008312
Strand	-
Start bp	5547340
End bp	5548521
Gene Length	1182 bp
Protein Length	393 aa
Translation table	11
GC content	32%
IMG OID	638108565
Product	hypothetical protein
Protein accession	YP_723154
Protein GI	113477093
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.496069
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.349432
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCATCAAC CACAAATTTC TAGTTACATC GGTCTAGTTC AGTCCTTATT AGTTTCACCT 
TCTGGTAATG AAAATAAAAT CTTACAAGCT AATCAAGATT TACTAGATTT GGGATTAGTT 
CAAGTCATGA AAAAAATAGC AAAGTTTAAT AGAAAAATAG ATGGTTTGCA TGCTCAATGG 
TTGGAAAATT TGGCAGCAAT ATTAGAGATA AATTTAAAAA ATATTTCCCT ATCTGTAGAT 
GAAAAAAAAT ATATAATTTT CTTGATGCAG GTATTACAAA TAATATCTGA TAATGATGTA 
AAACTAGAAA ATATTTATTC ATTATTAGAA TATAATCAGG ATCTACTTAA TAAAAATTTT 
CTCAAAGTTA TACAAACTTG GGCTGGTGAA AATTTGCCAA AAATGGAGCA AAAATTAGCG 
CAAAATATCG CTCTAGATAT TATTAGTTTT AGTAACCTAA TTCTACAATT TCCTTTGGGA 
AATCAAAGTA ATAATGTAGA AATAGCAATA GCAGGTTATG AAGTGGCTTT AAAAGTTTTA 
AGCTGTCAAG AATTTCCAGA AATTTGGGGA ACTATTCACA ATAATTTAGG TAGTAGCTAC 
CAAAAACGTA CTATTGGAAA CTTAGAAGAA AATATAGAAG TAGCGATCGC TTGTTATGAT 
AAAGCTCTTG AAGTTAGAAC TAATTCTGCG TTGCCTGAAA CATGGGCAAC TACTCAAAAT 
AATTTGGGGA ATGCTTATCA ACAACGTATT GCCGGAAGAA GAAAGGAAAA TTTGGAAAAT 
GCTATTAGTT GTTATCAGAA AGCTTTAACT GTGAGGCGTT TAGAGAAGTT GCCTCAAGAA 
TGGGCAACTA CTCAAAATAA TCTGGGTAGT GCTTACCATG AACGTATTGC TGGAGAAAAA 
AAGGAAAATA TTGAAGTGGC GATCGCTTGT TATATTTTTG CTCTTAAAGT ACGGACTAAG 
GAACAGTTTC CCCTAGACTG GGCAACTACT CAAAATAATC TGGGAAATGT TTATCTAGAT 
CGGATGATGG GAGATAAACA AAATAATCTC AAGCAGGCGA TCGCTTGTTT TGTTAGAGCC 
CAAGAGGTTT ATACTCAAGA AAGTTATCCT GTCTATTGGG AAATAATTTC TCATAATTTG 
AGTATGGTCT ATGATGAACG GAGGTTAAGA CAGGTAAGTT AA

Protein sequence

MHQPQISSYI GLVQSLLVSP SGNENKILQA NQDLLDLGLV QVMKKIAKFN RKIDGLHAQW 
LENLAAILEI NLKNISLSVD EKKYIIFLMQ VLQIISDNDV KLENIYSLLE YNQDLLNKNF 
LKVIQTWAGE NLPKMEQKLA QNIALDIISF SNLILQFPLG NQSNNVEIAI AGYEVALKVL 
SCQEFPEIWG TIHNNLGSSY QKRTIGNLEE NIEVAIACYD KALEVRTNSA LPETWATTQN 
NLGNAYQQRI AGRRKENLEN AISCYQKALT VRRLEKLPQE WATTQNNLGS AYHERIAGEK 
KENIEVAIAC YIFALKVRTK EQFPLDWATT QNNLGNVYLD RMMGDKQNNL KQAIACFVRA 
QEVYTQESYP VYWEIISHNL SMVYDERRLR QVS