Gene Sterm_4044 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sterm_4044
Symbol
ID	8599488
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sebaldella termitidis ATCC 33386
Kingdom	Bacteria
Replicon accession	NC_013517
Strand	-
Start bp	4303580
End bp	4304890
Gene Length	1311 bp
Protein Length	436 aa
Translation table	11
GC content	26%
IMG OID
Product	hypothetical protein
Protein accession	YP_003310807
Protein GI	269122630
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAGAAAA GAGTTCTAAT TTGGTTATTT ATATTAACTA ACATAGGAAT AAGTGAAGAA 
ATAATAAACT CTAAAAATGA AAAAGAAAAT AATAAAATAG TAGTTGAAGA GGCTGTAATC 
AAACAAAATG AAAATGAAGA TAAAAAATAT TATGAAATGA TTGATGGAAA AATTTACTAT 
AAAGAATACT GGGATACCCC TGTATTAGTT AAAGAAATTG ATGTAAAAAC TTTCGCTGAG 
TTAGAATATT CATATGCAAA AGATAAAAAT AATTATTATT ATAAAAATAA AAAAATACTT 
GTGGATAAGA ATAGTTTTGT TATAGAAAAT TATTTTATTG CTAAGGATAA AAATAATGTT 
TATGTGCTGG GCAGAAAGAT ACCGGGGTTT GCATCAGAAA AATTGAAGAT TTATGAGGGG 
GATACCAGAT ATATAACAGA CGGTACAGAT GTATATTTTA TAGACACGAA GTTGATGAAT 
TCCGACCCGA GTACTTTTGT AATTTTAGAT AATGAAACAG CAAAAGATAA AAATAATGTG 
TATAAGTATG GAGAGATTTT ATACGGTGCA GATTCCGAAA CTTTTGAAAT ATTAGGAAAT 
ATATACTCAA AAGATAAAAA TAAAGTATAC TCGATATCAT ATCCTATGGA TAAAGCTGAT 
GCTAAAAGCT TCAAAAGTAT AGGAGATTGG TATGGAAAGG ATAAAAATTT TGTATTTTAC 
AGAGATGATA TAGTGGAGAA TGCAGACTCC AAAACTTTCA AACATTTGGA ATATAAATAC 
GGGATAGATA AAAATTATGT CTATTATTCA AATAAAAGAA TAGAAGATGC AGATCCTCAA 
AGTTTTGTAT TATTGAATAA ATATGTAAGT AAAGACAAAA ATTATGTCTA TTATCTCACA 
TCAAAAGTAC TAAATTTTAA ACCTGAAGAT CTAAAAGACA GAAATATAGA TACTGATAAA 
TTTGTTATCC AAGAAAAAGA ATCTGAATAT AATATGGCAA TTTTAATTGA TGAATATGAA 
AAGAGAGAGA AAAAAAGACT AGAAGATTTA AGTGATAAGG GAATTACAGA AATGGGTTTT 
GATTATTATA TGTATAAAAA CTTGATTTAT TATAATGATA AATTTAGCAG GAAAATCTTT 
TTATACAAAG CTGATATAGA AACTTTAGAA GCAGTAGAAG ATAGTTATAA TGAAATTTTG 
AAGGATAAAA ACAGAGTATA CATAGCCGGG AGAATGTTAG AAGGGGCAGA TCCGGTAAGT 
TTTGAAGTAA TAACTGGAAG ATATTATAAA GATAAAAAAA TGTTTACATA G

Protein sequence

MKKRVLIWLF ILTNIGISEE IINSKNEKEN NKIVVEEAVI KQNENEDKKY YEMIDGKIYY 
KEYWDTPVLV KEIDVKTFAE LEYSYAKDKN NYYYKNKKIL VDKNSFVIEN YFIAKDKNNV 
YVLGRKIPGF ASEKLKIYEG DTRYITDGTD VYFIDTKLMN SDPSTFVILD NETAKDKNNV 
YKYGEILYGA DSETFEILGN IYSKDKNKVY SISYPMDKAD AKSFKSIGDW YGKDKNFVFY 
RDDIVENADS KTFKHLEYKY GIDKNYVYYS NKRIEDADPQ SFVLLNKYVS KDKNYVYYLT 
SKVLNFKPED LKDRNIDTDK FVIQEKESEY NMAILIDEYE KREKKRLEDL SDKGITEMGF 
DYYMYKNLIY YNDKFSRKIF LYKADIETLE AVEDSYNEIL KDKNRVYIAG RMLEGADPVS 
FEVITGRYYK DKKMFT