Gene Tery_3574 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tery_3574
Symbol
ID	4244323
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Trichodesmium erythraeum IMS101
Kingdom	Bacteria
Replicon accession	NC_008312
Strand	-
Start bp	5500175
End bp	5501224
Gene Length	1050 bp
Protein Length	349 aa
Translation table	11
GC content	35%
IMG OID	638108542
Product	Rieske (2Fe-2S) region
Protein accession	YP_723131
Protein GI	113477070
COG category	[P] Inorganic ion transport and metabolism [R] General function prediction only
COG ID	[COG4638] Phenylpropionate dioxygenase and related ring-hydroxylating dioxygenases, large terminal subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCTTCTT CTAAAATTAC TTTCTACCAT AGTATCCGTA ACTTGGGAAT TAACCAAAAT 
CATTGGTATG CTGTTGCTCG TAGTATAGAG CTTCAATCTC AACCTTTAAG TATTACCCTT 
TGGCATCAAA CAATAGTCCT TTACCGGGGC TGTAGTGGTA AAGTCTATGG TCTAGAAGAT 
ATTTGCCCTC ATCGTTTTGT TAAACTTAGT TCTGGTCGTG TGATCGCGGA TGAATTAGAA 
TGCACATATC ATGGATGGCG TTTTGAGTCA AATGGTAAAT GTTCTCATAT ACCCTATTTA 
GCAAGTAATC AAAAATTACC TAGTTGTCAA ATTCGGACTT TTCCGGTTCA AGAGCTACAT 
GGTTTCATCT GGCTATTCCC TGGAGATAAA TCATTGGCAA ATTTAATTTC TCCTTTAGAA 
ATTCCTGAGT GGGACCATCT CAATTATATT GCCACAATAT CAGTCATCAA ATGTCGCGCC 
CATTATTCCT ATTTAGTAGA AAATTTAATG GACATGTACC ACGGACATTT ACATCAAAAT 
TGGCAAGCGT GGGCAGCAGC AAAATTAATA GACTTATCTG AAAATGACCA TCGAGTAGAT 
GCTTATTATG AAGCTCAAAG CTATTATAAA ATAGATAAAA TTTGGTCAAT ATCTCAATTA 
ATATTTCCCA GTTTACGACA ACTCCATCCT GAGCCATTAA ATGTTAGTTA TATATATCCA 
AATTGGGTTT CTAACCTCGG AAAAGATTTT AAAATTTACT GTCTTTTATT ACCAATTAAT 
GAAAGAGAAA CTCAAGCTTA TTTAATTCAC TTTACATCCC TTCAAGCCTT TTGGCGTTTA 
CATAAACTCC CAGAATGGTT TAGACGATTT GTAAAAAGAA TTTTGTTTGG TTCAGCTCAA 
AAACTACTCG ATGGTTTAGT ACAGCAAGAT GTAGAGATGA TAGAAGAAGA ACAGCAAGCT 
TATCTAAAAA ATCCTCAGCA ACGTAATTAT GAGTTAAATA GGGCTCTAGT TAGTACACAA 
AGGTTAATTA GAAAACAAGC CATCAAATGA

Protein sequence

MSSSKITFYH SIRNLGINQN HWYAVARSIE LQSQPLSITL WHQTIVLYRG CSGKVYGLED 
ICPHRFVKLS SGRVIADELE CTYHGWRFES NGKCSHIPYL ASNQKLPSCQ IRTFPVQELH 
GFIWLFPGDK SLANLISPLE IPEWDHLNYI ATISVIKCRA HYSYLVENLM DMYHGHLHQN 
WQAWAAAKLI DLSENDHRVD AYYEAQSYYK IDKIWSISQL IFPSLRQLHP EPLNVSYIYP 
NWVSNLGKDF KIYCLLLPIN ERETQAYLIH FTSLQAFWRL HKLPEWFRRF VKRILFGSAQ 
KLLDGLVQQD VEMIEEEQQA YLKNPQQRNY ELNRALVSTQ RLIRKQAIK