Gene Tery_4118 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tery_4118
Symbol
ID	4245632
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Trichodesmium erythraeum IMS101
Kingdom	Bacteria
Replicon accession	NC_008312
Strand	-
Start bp	6352422
End bp	6353438
Gene Length	1017 bp
Protein Length	338 aa
Translation table	11
GC content	41%
IMG OID	638109019
Product	prepilin-type cleavage/methylation-like
Protein accession	YP_723599
Protein GI	113477538
COG category
COG ID
TIGRFAM ID	[TIGR02532] prepilin-type N-terminal cleavage/methylation domain

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.29573
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTACAACT TGCAAAAACT ACTAATAAAA GCCCTATCAA ATAGCAAGCT ACAAAAAGCC 
AGCAATTTAA CAAGTGGTTT CACAATGACT GAACTGCTAG TAGCAACAGC TGTGGCGAGC 
ATAATTATTG TACCAATATT GACCTTTGCC GTAGATATGC TCAACCGAGA TGTGGGGGAG 
CAGGCAAAGG CTAACAGTGA GCAGGAGCTA CAAACGGCTA TTAGCTATAT TGCTCAGGAT 
ATGAGTCAAG CGTTTTATGT TTATGAGCCT GACTATGTTG GAGAACCAGG CAAAACTCCT 
CCTATCCCTA GCTATGATGA TTTTATTAAG CAACTACCGC ACTCTGAGGA TGAGGACAAA 
GACCCTATCC TTGTTTTCTG GAAGCGAAAG TTTATAGAAC ATTCTATACC TATTGACGAT 
AAGGATACGT CTATTAATTG TCCGGCAGAT GAAAATAAGT GTGACGACGG CTTTGTCCAG 
TCGTTAGTTA TTTATTATTT AATAGAAGAG CAGGATAAGA ATAGCATCTG GTGTCAGCCA 
TCTGGTAGTA GTTGCCCCAA GCGCATAGCT AGGTTTGAAA TACAGGATGG GGTAAAAGAT 
TATTGGGGTA ACTATTTCTG TGGTACTGAC GGTCGCTCAG AAGAATGCTC AGGAAGTAAA 
AAGAAATTTA AACGAGACTT GGGCTACACT TCCTATGATA ACAGTAATCC TACTGGCTGG 
ACTAAAAAAG AAGGTGAAGA CTACAGTAAC AGCCCGGTTG TATTAGTAAA TTACATAGAA 
GACTTTACCC TAGACTCGGC AAGTGACTAT ACAAAAGACT CTGAAATAAA GCAAACAGAA 
TTAGCAAAAG GTAAAACGCT AGCTAGAGTC ACAATTCTAG GTAATGCTAT GCGCCGCCGT 
CGAGATGGCT TCAGTTGCAT AGAAGACAAT TCGACAACTC CTCCAACGTA TAAAAAATCT 
CCATATTGTC CAAAAGCAAC TGCACAAGTG GGACCGCGTA GTGGCTTTGG GGAATAG

Protein sequence

MYNLQKLLIK ALSNSKLQKA SNLTSGFTMT ELLVATAVAS IIIVPILTFA VDMLNRDVGE 
QAKANSEQEL QTAISYIAQD MSQAFYVYEP DYVGEPGKTP PIPSYDDFIK QLPHSEDEDK 
DPILVFWKRK FIEHSIPIDD KDTSINCPAD ENKCDDGFVQ SLVIYYLIEE QDKNSIWCQP 
SGSSCPKRIA RFEIQDGVKD YWGNYFCGTD GRSEECSGSK KKFKRDLGYT SYDNSNPTGW 
TKKEGEDYSN SPVVLVNYIE DFTLDSASDY TKDSEIKQTE LAKGKTLARV TILGNAMRRR 
RDGFSCIEDN STTPPTYKKS PYCPKATAQV GPRSGFGE