Gene Tery_1476 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tery_1476
Symbol
ID	4241682
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Trichodesmium erythraeum IMS101
Kingdom	Bacteria
Replicon accession	NC_008312
Strand	+
Start bp	2239624
End bp	2241048
Gene Length	1425 bp
Protein Length	474 aa
Translation table	11
GC content	36%
IMG OID	638106628
Product	hypothetical protein
Protein accession	YP_721238
Protein GI	113475177
COG category	[S] Function unknown
COG ID	[COG0397] Uncharacterized conserved protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.276999
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	6
Fosmid unclonability p-value	0.151455
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCTAATC CTTTACTTTC TCTCAACTAT GAACCTGCCA TTCAAGCTTT AGGCGGTGAC 
TATTATGATG AGGTACTTTC TGCTGAATTT CCACAACATA TTTTGCGATT TCGTAATGAT 
CAATTACTCC CTAAAATAGG ACTAAATTCT CAAGATGTTA AGGATGAGCA TTTTATTGAA 
GCTTTTGGTA AGTTTCATTG TGTTAGGCCT TTTTTAGCTC TACGTTATCA CGGTTATCAA 
TTTGGTGAAT ATAACCCTTA CTTGGGAGAT GGTAGGGGTT TTCTTTATGG TCAAGTGCGT 
GGGGTAGACG ATGAATTATA TGATTTTGGT ACTAAGGGTT CGGGTAGAAC CCCTTATTCT 
CGCAGTGCTG ATGGTAGACT TACTCTCAAA GGAGGGGTAC GCGAGGTTTT AGCTGCTGAA 
ATTTTGCACC GTCATGGGGT TCGTACTTCT CGATGTCTAA GTTTGATTGA AACTGGGGAA 
GGGTTATGGC GTGGGGATGA ACCTTCTCCT ACTCGCTCGT CGGTGATGGT GCGTTTTAGT 
CGTTCTCATA TTCGCTTTGG AACTTTTGAA AGACTTCATT TTTATAAGCG CCCAGATTTA 
ACGAAAAAAC TATTAAACCA TGTAATTAAT TGTTATTATT CTAATCTGAA AAAAGAGAAT 
ATTTCCCAAA AGGATCCGTT TCAAGATTGC TATTTTTTAT TCTACTTAGA ATTAGTAAAA 
AGAATTGCAA AATTAGTTGC TCAATGGATG GCTGCTGGAT TTTGTCATGG TGTATTAAAT 
ACAGATAATA TGTCAATTAC TGGAGAAAGT TTTGATTATG GTCCATACTC TTTTATTCCC 
ACATATAATC CTAAATTTAC AGCAGCTTAT TTTGATTATT CTGGTCTTTA TCGTTATAGT 
CATCAACCAT TAGTTTGTAA GTCAAATTTA CAACTACTTC AAGAAGCATT AGCTGCAGTT 
ATTGACCGGA AGAATATGAG GTCAGCCTTA GAAAAATTTG ATGATTTTTA TCTACATGAA 
TATCGACAAT TAATGATGAG GAGACTAGGG TTTAAAAAGT TAGCTGAAGC CGATGCAGAT 
AAGTTACTTC AGCTAACCAT AAAAATGCTC ACAGACTCTC AGGTTGGATA CCACGATTTC 
TTTTTGGAAT TAAGACAAAA ATTTTCTCCC GAATGGCGTG ATGATATTAG TCAGATTTTT 
GCTGATTTTG AACAGCCAGA ATTAATTGAT CCGTGGCGAC AATATTATTA TCATCTTTTG 
CAGACTTATT CTGATAATGA ATTAGAGGAA ATGACGGAAA GGTTACAACA ATATAATCCA 
CAACAAAGTT TAATTAGACC TGTCATTGAG TCAGTCTGGG AAGCAATTAC ACTAGAGGAT 
AATTGGCAGC CATTTTATGA TTTATTACAG CAAATATATG ATTGA

Protein sequence

MSNPLLSLNY EPAIQALGGD YYDEVLSAEF PQHILRFRND QLLPKIGLNS QDVKDEHFIE 
AFGKFHCVRP FLALRYHGYQ FGEYNPYLGD GRGFLYGQVR GVDDELYDFG TKGSGRTPYS 
RSADGRLTLK GGVREVLAAE ILHRHGVRTS RCLSLIETGE GLWRGDEPSP TRSSVMVRFS 
RSHIRFGTFE RLHFYKRPDL TKKLLNHVIN CYYSNLKKEN ISQKDPFQDC YFLFYLELVK 
RIAKLVAQWM AAGFCHGVLN TDNMSITGES FDYGPYSFIP TYNPKFTAAY FDYSGLYRYS 
HQPLVCKSNL QLLQEALAAV IDRKNMRSAL EKFDDFYLHE YRQLMMRRLG FKKLAEADAD 
KLLQLTIKML TDSQVGYHDF FLELRQKFSP EWRDDISQIF ADFEQPELID PWRQYYYHLL 
QTYSDNELEE MTERLQQYNP QQSLIRPVIE SVWEAITLED NWQPFYDLLQ QIYD