Gene Mext_0804 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mext_0804
Symbol
ID	5832180
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium extorquens PA1
Kingdom	Bacteria
Replicon accession	NC_010172
Strand	-
Start bp	865161
End bp	866618
Gene Length	1458 bp
Protein Length	485 aa
Translation table	11
GC content	66%
IMG OID	641366580
Product	phage uncharacterized protein
Protein accession	YP_001638280
Protein GI	163850237
COG category	[S] Function unknown
COG ID	[COG5410] Uncharacterized protein conserved in bacteria
TIGRFAM ID	[TIGR01630] phage uncharacterized protein (putative large terminase), C-terminal domain

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	43
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGTTCCACG ATACCCAGCT GCGCGACGCG CTCCTGCGCG AGTACCTCTA CTTCTTCGCC 
TGGAAGGCGT TCGCCGGCCT GCACCCCGGC GACAGCTTCA TCCCGGCTTG GCACGTGCGC 
GCGATGACGC ACGCGCTTGA GCGGGTTGCC CGCGGCGAGT GCCGGCGCCT GCTCATCACC 
GTGCCGCCTC GCCACCTCAA GTCGATCTGC ACGGCCGTCG CTTTCCCAGC TTGGCTGCTC 
GGCCGTGATC CCAGCATCAA GATCATGGTC GCGAGCTACG GAGGAGAGCT GGCTGCCAAG 
CATGCTCGCG ACTTCCGGCT GCTGCTGGGC CAGGATTGGT ACAGAGCACT GTTCCCAGGT 
ACCCGGCTGG CGCTGGGCGG CAACCGCGAG GACGAGCAGA TCACCACCGC CAAGGGTGGC 
CGCAAGGCGC TCTCGCTGGG TGGTGCCGGG ACAGGCTTTG GCGCCGACCT CATCATCATC 
GACGACCTGA TGAAGGCGGG TGACGCCTCC TCACCGGCCA AGCGCGAAGA GGTCAGGGCC 
TACTACGAAC AGACGCTGCT CTCGCGCCTG AACGACAAGG CGAGCGGGCG CATTGTAGCC 
ATTCAGCAGC GGCTGCACGA GGACGACCTT GCCGGCTACC TGATCAACTC CGGCCAGTTC 
GAGCACCTCA ACCTGCCGGC GATCGCCATC CAAGAGGAAG CGGTGCCGAT TGGCTTCGGC 
GAGGTTCATC ATCGCAGCAA GGATGCGGTG CTGTGCCCGG AGCGAGAGCC GCGACAAGTT 
CTGGAAGAGC TGCGTGTCAG CATGGGCGGC GCTGCCTTCT CCGCGCAGTA CCAGCAGGAT 
CCGACGCCTC CTGGCGGTAA CCGGATCCGC TGGGAGTGGT TCGGCAGCTA CGACACGCCG 
CTTCCGCGGG AGTCCTACCA GTGCGTGGTT CAGAGTTGGG ATACGGCGCT GACGGCGGAG 
CCGACGAGCG ACTTCTCAGT CGGCCTGACC TTCGGATTCC ACGACGGGCG CTGGCATCTG 
CTCGATCTGG AGCGACAGCG GCTGGACTTC CCGGACCTGA AGCGTCGGGT TCAGGGGCTT 
GCTGCCCGCT GGAAGGCTGA CGTCGTCGTC GTGGAGCATG CCGGCTCGGG CATCTCCCTT 
CTGCAGCAGC TGAGACAGGA GGAGAGCAAC CGGGCACGGC TCTTCGTCGA TTGGCCCGTC 
CGACTGGACA AGCGCACAAG GCTCGAGGCG CAGACGGCGC GATTGGAGAG CGGCCGTTAT 
CGGCTGCCGC GTGAGGCGCC GTGGCTTGAG GTGTTTCGGC GGGAGCTGTT GGCGTTTCCG 
AACGGCCGGC ATGACGATCA GGTCGACAGC CTGGTGCTGT TCCTGGAGTG GTCGTCATGT 
CCGCGTGCGC TGGACTTCCC CCGGCGAGAC CCTGTCACGG GGCGACCACT GCGTCGATCG 
CGGAACCGCT TCGGATAG

Protein sequence

MFHDTQLRDA LLREYLYFFA WKAFAGLHPG DSFIPAWHVR AMTHALERVA RGECRRLLIT 
VPPRHLKSIC TAVAFPAWLL GRDPSIKIMV ASYGGELAAK HARDFRLLLG QDWYRALFPG 
TRLALGGNRE DEQITTAKGG RKALSLGGAG TGFGADLIII DDLMKAGDAS SPAKREEVRA 
YYEQTLLSRL NDKASGRIVA IQQRLHEDDL AGYLINSGQF EHLNLPAIAI QEEAVPIGFG 
EVHHRSKDAV LCPEREPRQV LEELRVSMGG AAFSAQYQQD PTPPGGNRIR WEWFGSYDTP 
LPRESYQCVV QSWDTALTAE PTSDFSVGLT FGFHDGRWHL LDLERQRLDF PDLKRRVQGL 
AARWKADVVV VEHAGSGISL LQQLRQEESN RARLFVDWPV RLDKRTRLEA QTARLESGRY 
RLPREAPWLE VFRRELLAFP NGRHDDQVDS LVLFLEWSSC PRALDFPRRD PVTGRPLRRS 
RNRFG