Gene Tery_3933 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tery_3933
Symbol
ID	4244016
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Trichodesmium erythraeum IMS101
Kingdom	Bacteria
Replicon accession	NC_008312
Strand	+
Start bp	6079121
End bp	6080560
Gene Length	1440 bp
Protein Length	479 aa
Translation table	11
GC content	40%
IMG OID	638108855
Product	hypothetical protein
Protein accession	YP_723437
Protein GI	113477376
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.218593
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	0
Fosmid unclonability p-value	0.0000403133
Fosmid Hitchhiker	No
Fosmid clonability	unclonable

Sequence

Gene sequence

ATGACCAAAA ATATTATAAA TACTATGACC ATAGATGCTG ATACCTTTTT TCAGGCAATA 
AACCCTAGGG TTCCTCTGTT TATAGATAAT GCGGAAATTG ACAAAAAATA CTATATTGAC 
TTTTCTCCGG TGCGTGGGCA ACAGGTGATT AAGGATTTGA AGTCTACTAT TACTCGTTGG 
TCTAAAGGTA AACCTACCTG TCAATTATTT ACTGGACATA TTGGTTGTGG TAAGTCTACA 
GAACTCTGGC GACTGAAGCA ACAGTTGGAA ACAGCAGGTT ATCATGTTGT TTATTTTGAG 
TCTGAAAAAA ACCTGGAAAT GGTAGATGTG GATGTTAGTG ATATTCTTTT GACTATTGCC 
CAAAAGGTGA GTGAAAGTTT GGAGAAGTTA GAAAGATTAA ATTTGGAAGA GCCAAAAAGG 
CTAAAAGGTC TACTTCAGAG TATTGTTAAA TTATTACAGA CAGAAATTGA ATTTTCGGCA 
GAAACTACTG TTCCTGGTGT GGGTAAGTTG TCAGCTAGCA GTGATGGTTC ATTTTCGGCA 
GATTTAGGAA TAGTTGAAGT GAAGGCTGAT GAGGAAGGGT TAGAGTTTGT GGCTTCAGGT 
ATTGGTAAAA TTTCTGCACA GGCAAAGGGT AGCCCGGAAC TCCGCACTAA ACTGAGGGAA 
TATCTGGGAC CTCGCACCCC TGGAATTATT GAGATGATCA ACAAAGAGTT GCTTGAACCT 
GCTGATCAGA AGTTGAAAGA GTATGGTAAA AAGGGGTTGG TTGTGATCGC TGATAGTCTT 
GATAAGGTTG ATAGTTCCCC AAAACCTTGG GGTAGAAATC AGCAGGAATA TTTGTTTGTA 
GACCGAGGAG AGCAACTAAC AAGCCTTCAG TGTCATCTGA TTTATACTTT ACCTATAGCA 
CTGCGTTTTT CTAATGACTA CGGTACTTTA ACTCAAAGGT TTGATGCTCC TAAGATATTG 
CCGATGGTAG CTACACAGTT ACAGGATGGC AGTGAATGTA TTGCTGGAAT GGAGTTAATG 
CGACAGTTGG TTTTGGCTAG GGCTTTTCCA GAGTTAACAC CACAGGAAAG GTTGGCAAGG 
GTGACGGAAG TGTTTGATAG TCAGGAAACT TTAGACTATT TATGTTGGGT TAGTGGGGGT 
CATGTCAGGA ATATGTTCCG AATGGTACTT GATGCTCTCA AGGAGGAGGA TGACTTACCT 
ATTTCTCGTG GGAGTGTTGA CAATGTAGTG AGAAATTATC GCAATGAACA ACTTTTGGCT 
ATAGATGATC ACGAGTGGGA GTTATTACGG CAGGTAGTTC AAACAAAAAA AGTAACGGGT 
GATGACGGAT ACCAAATTTT AATCCGGAGC ATGTTTGTTT ATGAGTATCA ATATGACCAG 
AGTTCTTGGT TTAATATTAA TCCTCTTTTG AAAGATGCAC CAGAATTGAA GATAAGTTAA

Protein sequence

MTKNIINTMT IDADTFFQAI NPRVPLFIDN AEIDKKYYID FSPVRGQQVI KDLKSTITRW 
SKGKPTCQLF TGHIGCGKST ELWRLKQQLE TAGYHVVYFE SEKNLEMVDV DVSDILLTIA 
QKVSESLEKL ERLNLEEPKR LKGLLQSIVK LLQTEIEFSA ETTVPGVGKL SASSDGSFSA 
DLGIVEVKAD EEGLEFVASG IGKISAQAKG SPELRTKLRE YLGPRTPGII EMINKELLEP 
ADQKLKEYGK KGLVVIADSL DKVDSSPKPW GRNQQEYLFV DRGEQLTSLQ CHLIYTLPIA 
LRFSNDYGTL TQRFDAPKIL PMVATQLQDG SECIAGMELM RQLVLARAFP ELTPQERLAR 
VTEVFDSQET LDYLCWVSGG HVRNMFRMVL DALKEEDDLP ISRGSVDNVV RNYRNEQLLA 
IDDHEWELLR QVVQTKKVTG DDGYQILIRS MFVYEYQYDQ SSWFNINPLL KDAPELKIS