Gene MmarC5_0140 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	MmarC5_0140
Symbol
ID	4927792
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methanococcus maripaludis C5
Kingdom	Archaea
Replicon accession	NC_009135
Strand	-
Start bp	118052
End bp	119170
Gene Length	1119 bp
Protein Length	372 aa
Translation table	11
GC content	36%
IMG OID	640165640
Product	Allergen V5/Tpx-1 family protein
Protein accession	YP_001096672
Protein GI	134045186
COG category	[S] Function unknown
COG ID	[COG2340] Uncharacterized protein with SCP/PR1 domains
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	0.697458
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGATTGGC CGTTTAAAGC TTTTACATTA ACGTTAATTA CACTATCCTT ATTAGTAGCC 
GCTAGCGCAA ATTGTGTCTT CGATGGATGT GAACCAACTT TTTCAAACGT AACTTACCAA 
AATTTTAACG AAAACTATTC TAATTTATTT GATAACAACC ATAATCTATT CTTCGAATTA 
AACAGCCTTT TTAAAAATAA TTTGGACTAC AAGACTTTTG AAGTTAAAGC ATATGCTCCC 
CTGAAAAAGA CGTCTTCAAA AATAGATTTT CTTGAATCAA GATATGTTCC AGTGACTACG 
GTAGACACGT CTTCTGAAGA TAATACCGAC ACGTCTTCTG AAGATAATAC CGACACGTCT 
TCTGAAGATA ATACCGACAC GTCTTCTGAA GATAATACCG ACACGTCTTC TGAAGATAAT 
ACCGACACGT CTTCTGAAGA TAATACCGAC ACGTCTTCTG AAGATAATAC CGACACGTCT 
TCTGAAGATT ACGTTTATTT ACCTTCAAAA ATTACTCAAT CTCCAAAAAC ATCGCTATAT 
ATCATTAAAA CTACACAAGA ACCAGTAGTA GAAGAACCAG TAGTAGAAGA ACCAGTAGTA 
GAAGAACCAG TAGTAGAAGA ACCAGTAGTA GAAGAACCAG TAGTAGAAGA ACCAGTAGTA 
GATAAAAACT CATTGATTGA ACAATATATA TTAGACTATA CCAATATAGA ACGCTCCTCA 
TATGGACTCG ATGAGTTAAT ATTAGATAGT AAGTTAAGTC AAATTTCACA AGCTCATAGT 
GATGACATGG TGGAAAATGA TTATTTTTCC CATGTAAACT TAGATGGAGA AACTCCTACC 
GATAGGGCCA TTGCAGCAGA TTATAACGTT GTAAAATACC TAGGAGACGG ATATTACGCT 
ACAGGAATTG GCGAAAATAT TGCAAAAATG CCTACTGGCA ATGTAATTGG AATTGGATAT 
GTTTCAGACG ATGCTGAAAG TATTGCAAAA GCTATCGTGG ATGCCTGGAT GGATAGTCCC 
GGCCACAGGG CAAATATTCT AAACTCCCAA TACACCAATA TGGGCATAGG CGTATCTTTT 
GATGGTACGT ATTATGTTGC TACCCAAAAT TTCTATTAA

Protein sequence

MDWPFKAFTL TLITLSLLVA ASANCVFDGC EPTFSNVTYQ NFNENYSNLF DNNHNLFFEL 
NSLFKNNLDY KTFEVKAYAP LKKTSSKIDF LESRYVPVTT VDTSSEDNTD TSSEDNTDTS 
SEDNTDTSSE DNTDTSSEDN TDTSSEDNTD TSSEDNTDTS SEDYVYLPSK ITQSPKTSLY 
IIKTTQEPVV EEPVVEEPVV EEPVVEEPVV EEPVVEEPVV DKNSLIEQYI LDYTNIERSS 
YGLDELILDS KLSQISQAHS DDMVENDYFS HVNLDGETPT DRAIAADYNV VKYLGDGYYA 
TGIGENIAKM PTGNVIGIGY VSDDAESIAK AIVDAWMDSP GHRANILNSQ YTNMGIGVSF 
DGTYYVATQN FY