Gene Tery_3901 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tery_3901
Symbol
ID	4243564
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Trichodesmium erythraeum IMS101
Kingdom	Bacteria
Replicon accession	NC_008312
Strand	+
Start bp	6027159
End bp	6028307
Gene Length	1149 bp
Protein Length	382 aa
Translation table	11
GC content	33%
IMG OID	638108827
Product	hypothetical protein
Protein accession	YP_723409
Protein GI	113477348
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTTACAT ACATACTGGC CTTAGCTGTT GGTCTTGGTA GTTTAGCTTT GTATATAGTG 
GCCTTTTTCT TTCCAGAGGT CCATCGGAAA AACGATTTTA TCTGGAGTGG TGTAGGTCTT 
TTCTATGCCT TGGTATTGTG GTTTTGTGCA GGTAGAATTA CAGGTGCGGT GTTACTGGGT 
CAAGTGGCAA GTGTAGCTTT ATTAGGTTGG TTTACTTCAG AAAGTTTAAT GTTGCGTCGC 
CAAGTGACTC CAGTTGTAGA GCAAACCAAA ATATCAACTG AGAAAAGTAC TGAAGATTAT 
ACTCAGAAAA AATCAAAAAT TGTTTCTGAA ACAACATCTA TATCAGAAGT AGAGAATATG 
GAAAAATTAG ATTTATCTGA TTCCCCAATA ACCTCTACCA AACAGTCAGA AAATATTACT 
ACTGAAGAGT TGGTGAATAT TGTTAAAACA GGAGAAACTG AATCTGAATT ACTATCATCT 
GAAACTACTT CAGACTTAAG TAAAATAATC AAAGAATCTG AAGCAGAGAC AACTGAAAGT 
ATGACAGAAA AAAATGTTTT AACTGATGCT AAAACTGAAT TAGATACATC TCAGAAATTA 
GATAAAAGTT TATCTAAAAA AGCTCGTGGT TTTGCTCAGT TATTGACACC TATGAGTGGA 
ATATTGAGTA ATATTAAAAA TGTCATTCAA GGTAGAGATA ATAAAAATAC TGATTCTGAC 
TCAATATCTA CACAAAATCA AGCTGATACT GAGAAATTAA CTTCTATTGA GGAGGTAAAT 
ACTGAAGTTA ATGAGACTAT AAGTCAGACA GAAGATACTC AAGCTAAACA AGAATCTTTA 
ATAGAGAAAG AAGAGTCTAT AGTATCTGAT GTTAAAACAG ATAAAACTAC TTTGACAGAA 
GTTGAAAAGG AAGCAAACTC GTCTTCAAAA TTAGAATCTA CACCTACTGA AAAACCTGCT 
ACGGAAACTT CTAAATTAGC TGAAGTTTCT GCGCTTGAAG ATAGCTCTTC TTCACCAGAA 
ATAATAACTA CTCAAGATAG TCAGAATCAG GAAGAAAATT TGACTGCTAT TTCTTCTGAG 
GAGAAAAATG AGACTGATAA TTCAACATCA GATTTATCAA AAGATAGTCA AAATAAGTCA 
GTAGATTAG

Protein sequence

MLTYILALAV GLGSLALYIV AFFFPEVHRK NDFIWSGVGL FYALVLWFCA GRITGAVLLG 
QVASVALLGW FTSESLMLRR QVTPVVEQTK ISTEKSTEDY TQKKSKIVSE TTSISEVENM 
EKLDLSDSPI TSTKQSENIT TEELVNIVKT GETESELLSS ETTSDLSKII KESEAETTES 
MTEKNVLTDA KTELDTSQKL DKSLSKKARG FAQLLTPMSG ILSNIKNVIQ GRDNKNTDSD 
SISTQNQADT EKLTSIEEVN TEVNETISQT EDTQAKQESL IEKEESIVSD VKTDKTTLTE 
VEKEANSSSK LESTPTEKPA TETSKLAEVS ALEDSSSSPE IITTQDSQNQ EENLTAISSE 
EKNETDNSTS DLSKDSQNKS VD