Gene Tery_3033 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tery_3033
Symbol
ID	4244917
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Trichodesmium erythraeum IMS101
Kingdom	Bacteria
Replicon accession	NC_008312
Strand	+
Start bp	4684202
End bp	4685209
Gene Length	1008 bp
Protein Length	335 aa
Translation table	11
GC content	31%
IMG OID	638108064
Product	sucraseferredoxin-like
Protein accession	YP_722657
Protein GI	113476596
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG4759] Uncharacterized protein conserved in bacteria containing thioredoxin-like domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.262955
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	2
Fosmid unclonability p-value	0.00219158
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGAATAAGT TTTTTTGTTC TAGCGCTTGC CGAGAAGCAG ATGAAGACAT TATTGGAAGT 
GGTACGAATT ATTCAGTTTA TGTATTGATA GAATGTCCTT ACCCTTGGAA ACATAATGCT 
TTCGAGTCTC GTTTTTTACC AAAAAACTTA GAGATGTTGA TGGCAAAAGT GAAAAGGGAT 
AAATTGTCTC TCAGATTTTT ACTGATTACT CAAAATCAAA ATTATAGGCA AAATAACAGA 
AAGATTTTAA TTTATGAAAA AAATAAATCT TCATTTATCA ATAGTTATAA AAAATATGAG 
TTTGACGTAG ATCATCCTGA AAAAATAGCT CCAATTATTC AAAAATACTT AGCAGGAGAT 
AATTTAGATA CTAACACTCA AAATCCTCAA ATAAGAGATC TATTAGTTTG TACTCATGGT 
AGTCACGATA AGTGTTGTGC TAAATATGGT AATCCGTTTT ATGCGGAAGC TAAAAAAACT 
ATTTCTGAAT TGGGTTTAAA AAATACAAGA ATTTGGAAAA CAAGTCACTT TGGTGGTCAT 
AGGTTTGCAC CTACTATGAT TAGCTTTCCT GATGGTAGAT ATTATGGATT ACTTAATCGA 
GAATCTTTTC AAACAATTTT GCTACAAGCC GGGAATATAA AATTATTAAG CCAAGTTTAT 
CGAGGTTGGA GTATTTTACC AACTTCTATT CAAGTGTTGG AAAGAGAACT TATCTTCCGC 
CACGGTTGGG AATGGTTTGA GTATAAAATT AATCTTTTAC ATCTGGATAT TAATTTCGAT 
AAAACATTAG TTCAAACTCA ATTAGCTGTG CTTAAACCAG ATGGTTATCA ATATATTTGT 
CAAGCTAAAT TAGTTAAAGA TGAAAGTAAA ACTATCTATA TTAAAGGATC TTGTGATGCA 
TCTCACGAGT CCGAATTTAT AAAGTATGCT GTCAGTAATC TTAGCTTCAT AATTGAGAAG 
AAAACTTCTG AAAAAGTGTT AATAAGTTCT CATACAAAGG TTAGTTGA

Protein sequence

MNKFFCSSAC READEDIIGS GTNYSVYVLI ECPYPWKHNA FESRFLPKNL EMLMAKVKRD 
KLSLRFLLIT QNQNYRQNNR KILIYEKNKS SFINSYKKYE FDVDHPEKIA PIIQKYLAGD 
NLDTNTQNPQ IRDLLVCTHG SHDKCCAKYG NPFYAEAKKT ISELGLKNTR IWKTSHFGGH 
RFAPTMISFP DGRYYGLLNR ESFQTILLQA GNIKLLSQVY RGWSILPTSI QVLERELIFR 
HGWEWFEYKI NLLHLDINFD KTLVQTQLAV LKPDGYQYIC QAKLVKDESK TIYIKGSCDA 
SHESEFIKYA VSNLSFIIEK KTSEKVLISS HTKVS