Gene MCA1889 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	MCA1889
Symbol
ID	3104013
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylococcus capsulatus str. Bath
Kingdom	Bacteria
Replicon accession	NC_002977
Strand	+
Start bp	2031004
End bp	2032113
Gene Length	1110 bp
Protein Length	369 aa
Translation table	11
GC content	61%
IMG OID	637171046
Product	hypothetical protein
Protein accession	YP_114324
Protein GI	53803792
COG category	[R] General function prediction only
COG ID	[COG3943] Virulence protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCCGCA AACCACCGAC GACCGCCCCG AACCCCGGCG CCCCGACACC CGCACCGGGC 
GAAATCCCGT TCCTGCTCTA CACCGCCCAG GATGAAAGCG TCAAAGTGCG TGTGCTGGTG 
CAGGCCGAAA CGGTCTGGCT CACACAGCGC CAGATGGCCG AACTATTCGA CAAGGACGTG 
CGCACCATCA ACGAGCACAT CCGCAACATC TATGAAGAAG GCGAACTCAC CGAAGCGGCA 
ACTATCCGGA ATTTCCGGAT AGTTCAGACG GAGGGGGCGC GGCAGGTGAC GCGCGAGGTT 
GCCCATTACA ACCTGGACGT GATCATCTCG GTCGGCTACC GGGTCAAGTC TCATCGCGGT 
ACCCAGTTCC GCATCTGGGC CACCGGCGTG CTCAAGGAGT ACATCAAAAA AGGCTTCGTC 
CTCGACGACG AGCGCTTGAA GCAGGGTAAG CAGGTATTCG GCGAAGACTA CTTCCGCGAG 
CTTTTGGAGC GGGTGCGCTC CATCCGCGCC AGCGAGCGGC GCATCTGGCA GCAGATCACC 
GACATCTTCG CCGAGTGCAG CATCGATTAC GACCCGAAAA GCGAAATTAC CCAGGACTTT 
TTCGCCACGG TGCAGAACAA GTTCCACTAC GCCATCACCG GGCAGACCGC CGCCGAGATC 
ATCCACGCCA AGGCCGACCG CGCCGCGCCC AACATGGGGC TCACCACTTG GAAAAATGCC 
CCTTCCGGGC GCATCCTGCC CTCGGATGTG ACCGTCGCCA AGAATTACCT CGACGAGCCC 
GAGATCAAGC GCCTGGAACG CAGCGTCTCG GGCTTTTTCG ACTACATCGA AAACCTGCTC 
GAAAACCGGC GTCTGTTCAA CATGGCCGAG TTCGTCGCCG CCGTGGACAA GTTCCTCGCC 
TTCAACGAAT ACCGCGTGCT CGAAGGCCGC GGGCGGGTGA GCAAAAAGCA GGCGGACGAG 
AAGGCGCTGG CCGAATACGC CGAGTTCAAC AAGACGCAGC GGATCGAGTC GGATTTTGAT 
CGGTTTGTGA GGGAGCGCTA TGCCGAGTTC GACGCGCGGC GGCGAGAGAT GGAGCGCGCT 
TTGGAAGGCA AGGGGGGCAA AGATGCGTGA

Protein sequence

MSRKPPTTAP NPGAPTPAPG EIPFLLYTAQ DESVKVRVLV QAETVWLTQR QMAELFDKDV 
RTINEHIRNI YEEGELTEAA TIRNFRIVQT EGARQVTREV AHYNLDVIIS VGYRVKSHRG 
TQFRIWATGV LKEYIKKGFV LDDERLKQGK QVFGEDYFRE LLERVRSIRA SERRIWQQIT 
DIFAECSIDY DPKSEITQDF FATVQNKFHY AITGQTAAEI IHAKADRAAP NMGLTTWKNA 
PSGRILPSDV TVAKNYLDEP EIKRLERSVS GFFDYIENLL ENRRLFNMAE FVAAVDKFLA 
FNEYRVLEGR GRVSKKQADE KALAEYAEFN KTQRIESDFD RFVRERYAEF DARRREMERA 
LEGKGGKDA