Gene Mbur_2003 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mbur_2003
Symbol
ID	3996955
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methanococcoides burtonii DSM 6242
Kingdom	Archaea
Replicon accession	NC_007955
Strand	+
Start bp	2103960
End bp	2105348
Gene Length	1389 bp
Protein Length	462 aa
Translation table	11
GC content	43%
IMG OID	637959744
Product	Ig-like protein
Protein accession	YP_566632
Protein GI	91773940
COG category
COG ID
TIGRFAM ID	[TIGR03024] PEF-C-terminal archaeal protein sorting domain

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.0653567
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGAAAAATA AAACTCTAAG TAAAACATTT GTTGTTCTAC TAAGCTTGTT GATGATCCTT 
TCGATATCAT CAGCAGGTGC TAATGTGGTT GAACAAGGTA TAGCTGTTGA AAACCCTTCG 
GGTCCTGTAA TGAATTCAGT AATGTCGGTT GCTTCAACTT CACTGGCACC AGTTGTGACG 
GAGACTGGCA AAATTAGCCT TTCCATTGAT GGATATGGGG ATCACTTAAC TCCCGTTGGA 
TCCATTGATG TTGAAAAACC TGCTGGTGCA ACGGTCAGAT CAGCATATCT ATTGACTGCA 
AGTCTGTGGA GTGGTAACGA AATTCCTGAT GGTGGTGTAA CACTTGCAGG GTTTCCGGTC 
AATTGGGATG ATGTTGTCAT TGGAACTTAT TCTGGTGCTC CACACAATCA TCGTGCAGAT 
GTGACGAACA TTGTCAAACC AATTGTTGAC GCAGCTCCTG CAGGCAGGAT ATCAATTCCT 
ATTGAAGAAT CAGATGTACG TAATGTTGAG GGAAATATTC TTGCAGTGAT ATTTGATGAT 
CCCAATCAAG TAGAGGATAA TACTGTCGTT CTTTTGTTCG GTGCTCAAAG TATCACTGGT 
GATATGTTCA ACATTACGCT TGCAGAGCCT GTAGACAAGA CCGATCCTAA CTTCGCTTTG 
GATATGAGCC TTGGAATCTC TTTTGGGTTC CAGCCTAGTA ACCAGTACAG CATTGTAAAT 
GTCAATGGAC TGCGCCTGAC TTCTTCTGCA GGTGGATATG ATGATGGTAC GGATTACGAT 
GGTGGTTTGA TCACTGTTGG TGGTCTGGAT GACAGCAATG CAAATCCTGC TGACCCAAAC 
GCTCCTCCAG GAAATTCCCG CAGTGATGAT GAGTTGTATG ATCTCATCCC ATTCGTTAAT 
GATGGCGATA CTGGCATCAA CGTCTTTACA CAGAACCCTT CCAATGATGA CAATATCTAT 
TTCGCAGCTT TCTTTATGGG TTCTACAAAT GCTATTGTTG GTGAAGGCAT CTTACTTTCC 
CCGGATTCTG CAATAAACAA TCTTGGTGAA TCCCACGAAG TTACTGCGAC CGTTCAGGAT 
GATAATGGCG CTGCAGTAAC TGGCACAATG GTACACTTTG AGATTGCCTC AGGTCCTAAT 
GCAGGTACTA CTGCTGATGT CCTGACCGAT ACAAACGGAG AAGCTTCATT TAGTTTCACC 
AGTCAGTCGG TTGGTACGGA TGTAATTGTA GCTAGTTTCT TTAATTCACA GCAGGAACTA 
GTTCTCTCAA ACGAAGTTAC AAAGAAATGG ATCGTTAGTG AAGAGATCCC TGAATTCCCA 
ACAATTGCAT TGCCTGTGAT GGCAGTCCTT GGTTTGATGT TCCTTACAAT GAGAAGAAGG 
GAAGAGTAA

Protein sequence

MKNKTLSKTF VVLLSLLMIL SISSAGANVV EQGIAVENPS GPVMNSVMSV ASTSLAPVVT 
ETGKISLSID GYGDHLTPVG SIDVEKPAGA TVRSAYLLTA SLWSGNEIPD GGVTLAGFPV 
NWDDVVIGTY SGAPHNHRAD VTNIVKPIVD AAPAGRISIP IEESDVRNVE GNILAVIFDD 
PNQVEDNTVV LLFGAQSITG DMFNITLAEP VDKTDPNFAL DMSLGISFGF QPSNQYSIVN 
VNGLRLTSSA GGYDDGTDYD GGLITVGGLD DSNANPADPN APPGNSRSDD ELYDLIPFVN 
DGDTGINVFT QNPSNDDNIY FAAFFMGSTN AIVGEGILLS PDSAINNLGE SHEVTATVQD 
DNGAAVTGTM VHFEIASGPN AGTTADVLTD TNGEASFSFT SQSVGTDVIV ASFFNSQQEL 
VLSNEVTKKW IVSEEIPEFP TIALPVMAVL GLMFLTMRRR EE