Gene Tery_0937 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tery_0937
Symbol
ID	4245676
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Trichodesmium erythraeum IMS101
Kingdom	Bacteria
Replicon accession	NC_008312
Strand	-
Start bp	1471755
End bp	1473455
Gene Length	1701 bp
Protein Length	566 aa
Translation table	11
GC content	34%
IMG OID	638106192
Product	WD repeat-containing protein
Protein accession	YP_720804
Protein GI	113474743
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATTTATC TGAGAAAGAG GGCCCGCCCT TGGGTAAGTT CAAAATATAT CAAAATATTA 
AGTAAAATGA AAGTCGAAGA AGCATTGGAA GTTCTGGAGA CAGTTCTACC TCCAGGCTCC 
TTAAACGCTG TAAAAAAAAT GGTATTTTCT CAAGCCTGGG AAGATAAAGG ATATTCTGAA 
ATTGCCGAGC AAGCAGGTTA TGATCCAGAC TACATTAAAG GAGTAGCTGC TAACTTATGG 
CAAAGTATTT CTAATGTCTT AGACGAAAAA GTAACCAAGA AAAATTTTCG CGCTCTGCTG 
AGACAAAAAT TTGGCATTCA GAAATCATTT ATTGCCAAAA CCGAGCTAAA TACTCAACAG 
CATCTAACTT CCCTGTCTTC TTGTGAAACA AATAAAATAG TATATAAATC AAAAGTAATT 
GATTGGGGAG AAGCTATAGA TGTTTCTGTT TTTTACGGAC GCTCTCAAGA ACTCAATCAA 
CTGCAAAAGT ATATTATCGC AGATGGTTGT CGCTTGATAG CCCTACTTGG TATGGGTGGT 
ATCGGTAAAA CAGCGGTAGC AGCAAAAGTT GCTACACAAC TACAAAGTGA ATTTGACTAT 
ATAATTTGGC GATCGCTGCG CCACTCTCCA CCACTAAAAA TAATGCTGAG AGAACTGATC 
TCGTTTTTCT CTCACCAAAA ATGTACTCAA GGAGAACTAA GCAAACTTCT TGAATACTTA 
CGCCAGTCAC GCTGTCTAAT AATTTTAGAT AGTGTCGAAA CTATTTTAAA AGCTGGATGT 
ACAGGTTATT ACCGCTCTGG TTATGAAAAC TATAGTCAAT TATTTCAGTT AATCAGCGAA 
ACATCTCACT CTAGCTGTCT TATTCTCACC AGTAGAGAAA AACTCCCAGA AGTAGCAGCC 
CTTGAAAGTA TAGATACAGC AGTACGATCT TTGCAACTAT TTGGATCAAA AGAAATAGCT 
AAAGCCTTAC TAGAAACTAG AGAAATATCA GGTTCAGAAG CACAAAAACA ACAACTTAGC 
GAATATTATG GCTATAGTCC CCTAGCATTA AAAATAGTCA CTACCTCTAT CAAAGACTTA 
TTCGATGGAG ACCTAAAAGA ATTTCTCCAA CATAATACTA CTACCTTCAA TGGTATTCGC 
CGACTCCTCG ACCAACACTT TCATCGTCTT TCAGAACTAG AAAAAAAAAT TATGGTTTGG 
TTAGCAGTTA ACCAAGACTG GACTAGTGTA CAAAAATTAG AAACTGATAT TGTGCCAGCA 
ATTTCTAAAG TTAATCTCCT GGAAAGCTTA GAAGCTCTCA TCTGGCGCTC CATAGTCAAG 
AAAAAATTAA GTATGTATAC AGTTGAACCT CTAGTAATGG AGTACATTCT TAACTACCTA 
ATTGAAGAAG TTATTGGTGA ATTAATTACT ACTAACTTAA ACTTATTTGT TACTCATTCC 
TTAATCATAA CTACTGAAAA CTCCTCTATT AAAGAACGAC AAAATAAGTT AATTATTGAA 
CCAATTGCTA GACAACTAAG TAAAATATTT AGTTCTGATA AAACCCTCAA AAAACAATTA 
TTATTAATCC TAAATAAGCT AGAAAGTAAC GAAATTTTAC CATGTGGTTA TGGCAAAGAA 
AATCTTATTA ATCTTTCTAT TAAACTAGAG ATTGATTTAA TGAATATTGA TATTTATTCT 
CATAAAATAG AATATAATTA A

Protein sequence

MIYLRKRARP WVSSKYIKIL SKMKVEEALE VLETVLPPGS LNAVKKMVFS QAWEDKGYSE 
IAEQAGYDPD YIKGVAANLW QSISNVLDEK VTKKNFRALL RQKFGIQKSF IAKTELNTQQ 
HLTSLSSCET NKIVYKSKVI DWGEAIDVSV FYGRSQELNQ LQKYIIADGC RLIALLGMGG 
IGKTAVAAKV ATQLQSEFDY IIWRSLRHSP PLKIMLRELI SFFSHQKCTQ GELSKLLEYL 
RQSRCLIILD SVETILKAGC TGYYRSGYEN YSQLFQLISE TSHSSCLILT SREKLPEVAA 
LESIDTAVRS LQLFGSKEIA KALLETREIS GSEAQKQQLS EYYGYSPLAL KIVTTSIKDL 
FDGDLKEFLQ HNTTTFNGIR RLLDQHFHRL SELEKKIMVW LAVNQDWTSV QKLETDIVPA 
ISKVNLLESL EALIWRSIVK KKLSMYTVEP LVMEYILNYL IEEVIGELIT TNLNLFVTHS 
LIITTENSSI KERQNKLIIE PIARQLSKIF SSDKTLKKQL LLILNKLESN EILPCGYGKE 
NLINLSIKLE IDLMNIDIYS HKIEYN