Gene MCA1449 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	MCA1449
Symbol	pqqE
ID	3105037
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylococcus capsulatus str. Bath
Kingdom	Bacteria
Replicon accession	NC_002977
Strand	+
Start bp	1540197
End bp	1541318
Gene Length	1122 bp
Protein Length	373 aa
Translation table	11
GC content	61%
IMG OID	637170625
Product	pyrroloquinoline quinone biosynthesis protein PqqE
Protein accession	YP_113907
Protein GI	53804506
COG category	[R] General function prediction only
COG ID	[COG0535] Predicted Fe-S oxidoreductases
TIGRFAM ID	[TIGR02109] coenzyme PQQ biosynthesis protein E

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.0775464
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCTGGAT CAGAGAAATC ATCGCTTACT AAACCGCGCT GGCTGCTGGC GGAGCTGACC 
TACGCCTGCC CGCTGCAGTG TCCCTATTGC TCCAACCCCC TGGATTACGC CCGCCTGGGT 
GACGAGCTGA GCACCGAAGA ATGGAAGCGG GTGCTGAGTG AGGCCCGCGC GCTCGGTGCC 
GTCCAGCTGG GGCTTTCCGG CGGTGAACCG CTGACCCGCC GCGACTTGGC CGAAATCGTC 
ACCCACGCCC GCCAGCTCGG CTATTACACC AACCTCATCA CCTCGGGCTA CGGCCTGGAC 
GAAGTCCGCA TCGCCGAATT GAAGTCGGCC GGCCTCGACC ACATCCAGGT CAGCATCCAG 
TCGCCGGAAA AGCTGCTGAA CGATGAACTC GCCGGCACCG AGTCTTTCGA ACACAAACTC 
AAGGTGGCCC GCTGGGTGAA GCAGCATGGC TATCCCATGG TCTTGTGCGT GGTGATCCAC 
CGCCAGAACA TCCATCAGAT GCAGCAGATT TTGGAGATGG CGGACGAACT CGGGGCGGAT 
TACCTGGAAC TGGCCAACAC CCAGTATTAT GGTTGGGCCC TGCTCAACAG GGACCATCTG 
CTGCCGACCC GTGAGCAGTT CGCCGAAGCC GAGGCGATCG CGCAAAGCTA CAAGGAGAAG 
GTGAAGGGAC GGATGAAGAT CTACTACGTC GTCCCTGACT ACTACGAAGA CCGGCCCAAG 
GCCTGCATGA ACGGCTGGGG CACGACATTC CTCACCATCG CGCCGGACGG GATGGCCCTG 
CCCTGCCACG CAGCCCGCGA ACTACCCGGG CTGAACTGCC CCAGCGTACG CGACTTCAGC 
ATACGGGAAA TCTGGTACGA ATCGGCCGCC TTCAATCGTT TCCGCAGCTA CGGTTGGATG 
AAGGAACCCT GCCGCAGTTG TCCGGAGAAG GAAAAAGACT TCGGCGGTTG CCGCTGCCAG 
GCCTATCTCA TGACCGGCGA CATGGCCGAC GCCGACCCCG TGTGCAGCAA ATCCCCGCAC 
CATCATCGCG TGCTGGAAGC CATTGCGTCG ACACAGCGAT CTGCGAGCGA CAAACCGCTG 
TTCTTCCGCA ATGCCAGGAA CTCCCGAGCC TTGACGGGCT GA

Protein sequence

MAGSEKSSLT KPRWLLAELT YACPLQCPYC SNPLDYARLG DELSTEEWKR VLSEARALGA 
VQLGLSGGEP LTRRDLAEIV THARQLGYYT NLITSGYGLD EVRIAELKSA GLDHIQVSIQ 
SPEKLLNDEL AGTESFEHKL KVARWVKQHG YPMVLCVVIH RQNIHQMQQI LEMADELGAD 
YLELANTQYY GWALLNRDHL LPTREQFAEA EAIAQSYKEK VKGRMKIYYV VPDYYEDRPK 
ACMNGWGTTF LTIAPDGMAL PCHAARELPG LNCPSVRDFS IREIWYESAA FNRFRSYGWM 
KEPCRSCPEK EKDFGGCRCQ AYLMTGDMAD ADPVCSKSPH HHRVLEAIAS TQRSASDKPL 
FFRNARNSRA LTG