Gene MCA1003 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	MCA1003
Symbol
ID	3103760
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylococcus capsulatus str. Bath
Kingdom	Bacteria
Replicon accession	NC_002977
Strand	+
Start bp	1049465
End bp	1051129
Gene Length	1665 bp
Protein Length	554 aa
Translation table	11
GC content	67%
IMG OID	637170189
Product	hypothetical protein
Protein accession	YP_113480
Protein GI	53804877
COG category	[S] Function unknown
COG ID	[COG2989] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGGCGGCT TCCCACGGGG CCGGTTGGTT GCACTCGTGG CGGCATTTCT GATCAGCGCC 
GATGCCGCGG GCACCACACC GGATGCGGCG GCGCACATCG ATGGACTGCT CGCTTCGGGT 
GTCCACCCCC GCTTGCGCTG GGAGCGTTTC ACCGATTTCC AGGAGCCCTT GCGTGCCCTG 
TATCTTGCCC AGGGTTCACG GCCTTTGTGG CTGGACGGGG GCAGGCCGGT GAAGCAGGCT 
TCCGCCGCTC TCGAGTGTCT GCGCATGGCC GACGACCAGG GCTTGAACAG CAGCGACTAT 
GACGCCGATC TCCTGGGCGG CTGGATCGAG AAGCTCAACG ACGACAGGGC GGCGAGTGCG 
GAAGAGGTGG CGCAGTTTGA GGTGGCGATG AGTCTCGCTC TGATGCGCTA CGGCTCGAAT 
CTCGCCCGCG GCCGGGTCCA CCCTCGCGCC GCCGGTTTTG CTCTGGACGT GGCGTCGAAG 
CGGCTCGATC TACCGGCGCT GGTGCAGCAC CTCGCCCGCG ACCCCTGGCC CTGCGAGGCC 
ATCGCCGGGC TGGAGTCGAA GCTGCCACTG TACCGGAACC TCAAGGCGGC ACTGCCGCGT 
TACCGGGGAT TGGCCGAGAA CAACGATGTC TCGGCGCTTG CCCTCCCGCC CAAGCTCAGC 
CCGGGCGACC GCCACGGGGA GGTTCCCGCC TTGCGCAAGC GTCTGGCCGC TTTGGGTTTC 
CTGTGGCAAG AGTCGTCCTC CAAAGAACCG GAGGTCTATG CCGGCGATCT GGTCGAGGCG 
GTCGCGCGGT TCCAGGAGCG CCATGGTCTG GCACCGGACG GGGTGATCGG CAAGGGCACG 
CTGGCGGCGC TCAACGTGCC GCCTGCCGCG CGTCTCAGGC AGATCCGGCT GGGGCTGGAG 
CGGCTGCGCT GGCTGCCGGA GCGGTTCGAA GGCCCCTTCA TCCTGGTGAA CATCCCCTCC 
TTCCGTTTGT ACGGCTACGG CCAGGACCCC GAGCGGCCGG AGGTGTCGAT GAACGTGGTC 
GTGGGCCGGT CGTCGGGGGG ACACAACACG CCGGTGTTCC ATTCCGACAT GACCTACGTG 
GTGTTCCGCC CCTATTGGAA CCTGCCGCGC GCCATCACGG TCAAGGAGAT GCTGCCCGGC 
ATTCTGCGCG ACCCCGGCTA TCTGGCCCGC CACAACCTGG AGCTGGTGCC CAGCTTCGGC 
AACGGCTCCC AGGTCTACGA GCCCAGCCTG GAAAGCCTGG AGATGCTGTC GGCCGGCTCG 
CTCAAGCTGC GCCAGCGGCC GGGGCCGAAG AACGCGCTGG GGCTGGTCAA GTTCGCTTTT 
CCCAACAACG ACAACATCTA CCTGCACGGC ACGCCCAGCG TGAACCTGTT CCAGCGGGCG 
CGGCGGGATT TCAGCCACGG CTGCATCCGC GTCCAGGATC CCGTGGGCCT GGCGGAATTC 
GTCCTGAAAC GCGAGGGCGA GACCTGGACT CAAGAGCGGA TCGAGGAGGC GATGAACGGC 
GCCCAGTCGC GCACGGTCAC GCTGAAGCAG CCGCTGCCGG TCTACATCTA CTACTCGACC 
GTGCTGGCCG AGCCGGACGG TACCGTGCGG TTCTTCGAGG ACATCTACGG ACTCGACCGG 
GTACTGGAGC AGTTGCTGGA GAAGGGCTTC CCGTATCCCT CCTGA

Protein sequence

MGGFPRGRLV ALVAAFLISA DAAGTTPDAA AHIDGLLASG VHPRLRWERF TDFQEPLRAL 
YLAQGSRPLW LDGGRPVKQA SAALECLRMA DDQGLNSSDY DADLLGGWIE KLNDDRAASA 
EEVAQFEVAM SLALMRYGSN LARGRVHPRA AGFALDVASK RLDLPALVQH LARDPWPCEA 
IAGLESKLPL YRNLKAALPR YRGLAENNDV SALALPPKLS PGDRHGEVPA LRKRLAALGF 
LWQESSSKEP EVYAGDLVEA VARFQERHGL APDGVIGKGT LAALNVPPAA RLRQIRLGLE 
RLRWLPERFE GPFILVNIPS FRLYGYGQDP ERPEVSMNVV VGRSSGGHNT PVFHSDMTYV 
VFRPYWNLPR AITVKEMLPG ILRDPGYLAR HNLELVPSFG NGSQVYEPSL ESLEMLSAGS 
LKLRQRPGPK NALGLVKFAF PNNDNIYLHG TPSVNLFQRA RRDFSHGCIR VQDPVGLAEF 
VLKREGETWT QERIEEAMNG AQSRTVTLKQ PLPVYIYYST VLAEPDGTVR FFEDIYGLDR 
VLEQLLEKGF PYPS