Gene Tery_1054 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tery_1054
Symbol
ID	4241939
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Trichodesmium erythraeum IMS101
Kingdom	Bacteria
Replicon accession	NC_008312
Strand	+
Start bp	1648441
End bp	1649709
Gene Length	1269 bp
Protein Length	422 aa
Translation table	11
GC content	37%
IMG OID	638106286
Product	S-layer-like region
Protein accession	YP_720898
Protein GI	113474837
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	4
Fosmid unclonability p-value	0.0296969
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACAGATA CACCGACAAA ACTACCATCA CAGCTAAGGC CAGTAAAACC TGATGAGTGG 
ATTGCAATAT TTGTAGCTTT AGGGACTTTT GGCAGCATAT TTTTCTGGGC AACGACTGGA 
GAAAAGAATG GATTTAATCT ACTTTCTAAA CCCATGCTTT CTACACCTCT ATCTGAAAGT 
TTTGGTAGTT CCAATATTGC TTCTGGGAAG TCAATATTTA GCTTAGACAT ACCTCAACTT 
AAGACTTCGA CTGGTAAGTC AGGATCAAAT TTTGAAGAGA GCTCTCAAAA TCCTGAAGAA 
TTAGGAACAA GTCTGGATAC TTTGACTTCT ATGACTGATC CTGTTGAGGA TGATGAACCA 
AATCTTCAGA GTTTAGATCA AGTCAAGACT GAGACGAAGA CAATACCTAA ATTGTTTGAA 
GTGCTAAAAA AAATTAATCA AAAAGCTGCT CCGCCAGTTG CTGATAATTT GGGAATATTA 
GACAGTGGAA AGATATTATC TAAATCTCCA CCTACTATAT CATCGGAAGT TACAGATGAT 
CTAATAACAA CTGCTCCTCT ACCTGTAGCA CCTTCTATTC CTACTCCAAC AACAGAGTTA 
CCCCAAGAAA AGGAAACTTC TTTGCCTTCA ACAGCATTAC CCTCTCCTGA TATATCTTCT 
AGTAGCACGG TTAAATTTTC TGATGTTCCT AATAGTTTTT GGGCAAGTAG TTTTATTCAA 
TCTTTGGTAG AACAGGATTT TATTGCTCAG ATTAATAATG ATCAGTTTGA GCCAGACAAA 
CCTGTAACAC GAGCTGAATT TGCTGCTCAA ATTGCCAAAG TATTTGAGGA AAAATCAGCT 
AAAAAATCTG TTGTATATAA AGATATCAAA GGAGATTCAA CAGCTCAAAG TGAAATTCAA 
ACATCTACTA AATCTGGTTT TTTAAGTGGG TATCCAGGGG ATGTTTTTCG CCCAGAAGAA 
AAAGTATCAA GGTTGCAGGT GTTAGTTTCT TTAGCTAGTG GCTTAAGTCT AGAAATTCCA 
TCTGATCCTG ATAGTGTTTT AAGTGTTTAC AAAGACACAA CAGAAATACC TGATTGGGCT 
AAAGAAAAAG TAGCTGCTGC AACTGCTGCT GAATTAGTAG TGAGCCATCC AGATGTAAAA 
ATGCTGAATC CAAATCAACC TGCTACTCGT GCTGAAGTTG CAGCAGTTTT TTATCAAGCG 
TTGGTAAAAT TAGGGCAGGT AGAAAAGATT TCATCTGAGT ATATTGTGAA TCCGAAAAAG 
GAGAATTAG

Protein sequence

MTDTPTKLPS QLRPVKPDEW IAIFVALGTF GSIFFWATTG EKNGFNLLSK PMLSTPLSES 
FGSSNIASGK SIFSLDIPQL KTSTGKSGSN FEESSQNPEE LGTSLDTLTS MTDPVEDDEP 
NLQSLDQVKT ETKTIPKLFE VLKKINQKAA PPVADNLGIL DSGKILSKSP PTISSEVTDD 
LITTAPLPVA PSIPTPTTEL PQEKETSLPS TALPSPDISS SSTVKFSDVP NSFWASSFIQ 
SLVEQDFIAQ INNDQFEPDK PVTRAEFAAQ IAKVFEEKSA KKSVVYKDIK GDSTAQSEIQ 
TSTKSGFLSG YPGDVFRPEE KVSRLQVLVS LASGLSLEIP SDPDSVLSVY KDTTEIPDWA 
KEKVAAATAA ELVVSHPDVK MLNPNQPATR AEVAAVFYQA LVKLGQVEKI SSEYIVNPKK 
EN