Gene Tery_1741 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tery_1741
Symbol
ID	4245398
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Trichodesmium erythraeum IMS101
Kingdom	Bacteria
Replicon accession	NC_008312
Strand	+
Start bp	2650665
End bp	2652191
Gene Length	1527 bp
Protein Length	508 aa
Translation table	11
GC content	39%
IMG OID	638106865
Product	hypothetical protein
Protein accession	YP_721474
Protein GI	113475413
COG category	[S] Function unknown
COG ID	[COG1649] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.230988
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAAACAA AGTTTACCTC TTTGAAAAAA ATTAAATCTA GAAAATATTT TCATATAAAT 
AGTTTGGGAG CTATTTTATT TAGTCTGGCA GTAAATTTAT CCCCGTGGTT TTCAGCAAAA 
GTACAAGCAC AAACAGACAT TTATTGTAAG TTACCGCCAG AAGCGATCGC CTCTAAAGAA 
AATCTTCGCC AAGCAGTTTT AGAAGGAAAT AAAAATGCAG AAAAACAATA TCAAGATATC 
CTAATTAAGC ATAATAGAGA AGTTGGCAAT TGTCGCATGA GAAATTGGCC GAGAACTCAA 
GGTATTTGGT TGCGACTATA TCCTTGTGAT GCTAGACCAG GAGAAATTGA CAGGATACTA 
GATAAAATTG TTAATCAAGG TTATAACCAA GTATATATAG AAGCTTTCTA TGACGGGCAA 
GTGCTTCTAC CCGCAGCAAA TAACCCTACA GTTTGGCCTT CTATACTCCG TGTACCTGGT 
TATGAAAATG TCGATCTATT AGCTGATAGT CTGAAAAAAG CAAAGGAAAG AGGTTTGCGT 
GCTTATGCTT GGGTATTTAC CATGAATTTT GGGTACACTT ATTCTCAACT GCCTAACCGT 
CAACAAGCTT TAGCGCGTAA TGGTAGAGGT CAAACAACCC TGGATGTGAT TCCAGATAAT 
GTTAGTTTAC AGAACCAGTT AGGTGCGAGT CATGCTTTCC ATACTTTTAT AGATCCTTAC 
AGTCCCCAAG CACGGCAAGA TTATAATGTT ATGGTGAATG AGGTTTTAAA ACGACAACCT 
CAAGGAGTTT TATTCGACTA TATTCGTTAT TTGCGGGGAA TGGGGAGTGA CTCTGTAGCC 
GACCAGGTAA AAGATTTATG GATATATAGT GAGGCTTCTC AGAATGTGTT ATTGCAACGG 
GCTAAAAATG AAGCGGGAAA GGAATTAATT AGAAAATTTG TAGACAAGGG GTATGTTACT 
TCTCAAGAAA TTAATGGGAG AACTCCCAAA TGGCAACGTT TCTTTTCACC CTCTATTAAT 
AGCAGACTAA CGGAGCGAGG TTTGGAAACA CAAATTTGGG AATTGAGTGT TGCTCATGCT 
GCTCAAGGAA TACTAGATTT TCTCCAGGTA GCTAGTCAAC CAGTGCAAGA AAAAGGTCTG 
CCTGCTGGTG CTGTATTTTT CCCTGGTGGG AATAGAAGAA TACAGAGTAA TGGTTTTGAC 
TCTCGCCTCC AACCTTGGGA TCAATTTCCG ACTTCGATGG AATGGCATCC AATGGCGTAT 
GCAACTTGTG GCGATCTCGA TCCCAGTTGT ATTGTTTCTA AAGTGGAGAG AGTTATGAGT 
ATGACTCCTA AGGGGGTGAA AGTTATTCCG GCGATCGCTG GGGCTTGGGG AGAACCTTTG 
AAAAATCGTC CTTCTTTGGA AATACAAATG CAAGCTATTA AAGTCGCAAC TCCTCAGATT 
AATTCTATTA GTCATTTTTC TTATGGTTGG CAAAATATTG AAGAAACCAG GGAACGTAAA 
CATTGTCGGT TGTCAACTGG GAATTAA

Protein sequence

MQTKFTSLKK IKSRKYFHIN SLGAILFSLA VNLSPWFSAK VQAQTDIYCK LPPEAIASKE 
NLRQAVLEGN KNAEKQYQDI LIKHNREVGN CRMRNWPRTQ GIWLRLYPCD ARPGEIDRIL 
DKIVNQGYNQ VYIEAFYDGQ VLLPAANNPT VWPSILRVPG YENVDLLADS LKKAKERGLR 
AYAWVFTMNF GYTYSQLPNR QQALARNGRG QTTLDVIPDN VSLQNQLGAS HAFHTFIDPY 
SPQARQDYNV MVNEVLKRQP QGVLFDYIRY LRGMGSDSVA DQVKDLWIYS EASQNVLLQR 
AKNEAGKELI RKFVDKGYVT SQEINGRTPK WQRFFSPSIN SRLTERGLET QIWELSVAHA 
AQGILDFLQV ASQPVQEKGL PAGAVFFPGG NRRIQSNGFD SRLQPWDQFP TSMEWHPMAY 
ATCGDLDPSC IVSKVERVMS MTPKGVKVIP AIAGAWGEPL KNRPSLEIQM QAIKVATPQI 
NSISHFSYGW QNIEETRERK HCRLSTGN