Gene Tery_2393 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tery_2393
Symbol
ID	4244809
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Trichodesmium erythraeum IMS101
Kingdom	Bacteria
Replicon accession	NC_008312
Strand	+
Start bp	3696966
End bp	3698120
Gene Length	1155 bp
Protein Length	384 aa
Translation table	11
GC content	41%
IMG OID	638107484
Product	hypothetical protein
Protein accession	YP_722084
Protein GI	113476023
COG category	[S] Function unknown
COG ID	[COG1900] Uncharacterized conserved protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.882306
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGAACAA TTGCTGAAAT TAACCACAAA ATCTCCCAGA AAAAAGCTGT TGTCTGGACA 
ATAACAGAAC TCAAAGCCAG AATTACCGAA ACAAGCATTA CCCAAGCTGC AAAAGAAGTT 
GATGTAATTA CAACTGGCGC TTTTGAGCCA ATGGAGTCAT CTGGAGCCAT CATCAACTTG 
GGACATACTG ATCCCCCCAT CAAAATTCGC TCCTGTTGGC TAGATAGTGT CCCTGCTTAC 
TCAGGCTTTG GAGCTGTAGA TTTGTACCTT GGGGCAACTC AAATAGCTGA AGATACTGAA 
GAATTTAAAG AACGAGGTGG CGGCCATGTA ATCGAAGACC TAATCGCAGG TAAACCTGTT 
CACCTGAGAG CAATTGGTCA AGTAACAGAT TGTTATCCTC GAAGTACTTT TGAAACTACT 
ATTACTCGTG AGACAATTAA CCAATTTTAT TTATTTAACC CACGAAATTT ATATCAAAAT 
TTTATAGTTG GTGTGAATGG TGGCGATCGC CCTCTGTTTA CTTATCTTGG TCCTCTAATG 
CCCAACTTAG GTAATGCAGT TTATTCTAAC TCTGGTGCTA TTTCCCCATT ATTCAATGAC 
CCAGACTTAG AAATAATTGG TGTTGGTACC CGGATATTTT TGGGTGGTGG TATTGGGTAT 
ATCACTTGGG AAGGTACTCA GCACTTTCCC CTACAAAAAC GTCTTTCTAA TCGAACCCCT 
ATTGGACCTG CTGCGACTTT AGCCTTAATT GGAGATGCCA AACAAATGCA ACCTCAATGG 
GTGCGTGGTT GTTATTTTAA AAATTACGGT CCATCAATTA TGTTAGGTGT AGGAATTCCT 
CTACCCGTTT TGAATGAAAA AGTAGTAGCT AACTGTTCTA TTCAAGACCA AGATATTGTA 
GCGCCAGTTG TAGATTTTTC TATTCCCCGG CGGGTGCGCC CAACTTTTGG TCTAGTGAGT 
TATGCTCAAC TCAAATCTGG TCGGATAAAA ATAGAGGGCA AACTTGTGAG GAGTGCCCCC 
CTTGCAAGTA TCTTTCTATC TCATCAAATT GCCTTGGAGC TAAAAGAATG GATCGAAGCA 
GGAGAATTTA CTCTAACTGA ATCAGTTGCT CAACTTCCGA TGGATCGAAC TTTCTTACCA 
TTTCTGGAAC GTTAA

Protein sequence

MRTIAEINHK ISQKKAVVWT ITELKARITE TSITQAAKEV DVITTGAFEP MESSGAIINL 
GHTDPPIKIR SCWLDSVPAY SGFGAVDLYL GATQIAEDTE EFKERGGGHV IEDLIAGKPV 
HLRAIGQVTD CYPRSTFETT ITRETINQFY LFNPRNLYQN FIVGVNGGDR PLFTYLGPLM 
PNLGNAVYSN SGAISPLFND PDLEIIGVGT RIFLGGGIGY ITWEGTQHFP LQKRLSNRTP 
IGPAATLALI GDAKQMQPQW VRGCYFKNYG PSIMLGVGIP LPVLNEKVVA NCSIQDQDIV 
APVVDFSIPR RVRPTFGLVS YAQLKSGRIK IEGKLVRSAP LASIFLSHQI ALELKEWIEA 
GEFTLTESVA QLPMDRTFLP FLER