Gene MCA2202 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	MCA2202
Symbol
ID	3105073
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylococcus capsulatus str. Bath
Kingdom	Bacteria
Replicon accession	NC_002977
Strand	+
Start bp	2378928
End bp	2380109
Gene Length	1182 bp
Protein Length	393 aa
Translation table	11
GC content	64%
IMG OID	637171348
Product	aspartate aminotransferase
Protein accession	YP_114622
Protein GI	53803503
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0436] Aspartate/tyrosine/aromatic aminotransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCATAC GACTTTCCGA CCGCGTCCAG TCCATCAAGC CGTCCCCGAC TCTCGCCGTC 
ACCGCCCGCG CCGCCGCGAT GCGCGCCGCC GGCAAGGACA TCGTGGGACT GGGCGCGGGC 
GAACCGGACT TCGACACGCC GGACCATATC AAACAGGCGG CCATCCAGGC CATCGAAAAG 
GGTTTCACCA AATACACGGC GGTCGATGGA ACGCCCGGGC TCAAGCAGGC GATCCAGGCG 
AAATTCAAAC GCGAAAACGG GTTGGATTAC GCGCTCGATC AGATCCTGGT GTCCTGCGGC 
GGCAAGCAGA GTTTCTACAA TCTGGCCCAG GCCCTGCTCA ACCCCGGCGA CGAGGTCGTC 
ATCCCGGCGC CTTACTGGGT GTCCTATCCG GACATGGTGC TGCTGGCCGG CGCCGTCCCG 
GTGATCGTCG AGGCCGGGCA ACAGCAGGCG TTCAAGATCA CGCCGGCACA ACTGGAAGCC 
GCGCTGACGG CCAGAACCCG GCTGTTCGTG ATCAACAGTC CATCCAATCC CACCGGCATG 
GCCTACACCG CGGAAGAGCT GGCCGGCCTC GGTGAGGTGC TGCGGCGGTT TCCCGAGGTC 
GTCATCGCCA CCGACGACAT GTACGAGCAC ATCCTCTGGG AAGGTGGATT CAGCAACGTC 
CTGAACGTCT GCCCGGACCT GTACGAGCGG ACCGTGGTGC TGAACGGCGT GTCCAAAGCC 
TACTCGATGA CCGGCTGGCG CATCGGCTAC GCAGCCGGGC CCGAGCGGCT GATCGAGGCC 
ATGACCAACA TCCAGTCGCA GAGCACCTCC AATCCCACTT CGATCTCGCA GGTCGCGGCA 
GAGGCCGCGC TCAATGGCGA GCAGGGCTTC ATCGCCGGCA TGGTGGAGGC TTTCAAGCAA 
AGGCACGACT TCGTGGTCGG AAGACTGAAC GCCATTCCCG GCGTCGACTG CCTGAAAACC 
CACGGCACCT TCTATGTCCT GCCGAATGTC GAAGCGGCGA TGGCCAGGCT GCATCTGGCG 
GACGACGTGG CGCTGTCCGA ATACCTGATC GAACAGGGCG GCGTGGCCGT GGTGCCGGGC 
TCGGCTTTCG GCGCACCGGG CCACGTCCGT CTCTCCATCG CCACCAGCAT GGCCAATCTG 
GAAAAGGCCA TGGAACGCCT GGCGACCACC CTGTCCAAAT GA

Protein sequence

MSIRLSDRVQ SIKPSPTLAV TARAAAMRAA GKDIVGLGAG EPDFDTPDHI KQAAIQAIEK 
GFTKYTAVDG TPGLKQAIQA KFKRENGLDY ALDQILVSCG GKQSFYNLAQ ALLNPGDEVV 
IPAPYWVSYP DMVLLAGAVP VIVEAGQQQA FKITPAQLEA ALTARTRLFV INSPSNPTGM 
AYTAEELAGL GEVLRRFPEV VIATDDMYEH ILWEGGFSNV LNVCPDLYER TVVLNGVSKA 
YSMTGWRIGY AAGPERLIEA MTNIQSQSTS NPTSISQVAA EAALNGEQGF IAGMVEAFKQ 
RHDFVVGRLN AIPGVDCLKT HGTFYVLPNV EAAMARLHLA DDVALSEYLI EQGGVAVVPG 
SAFGAPGHVR LSIATSMANL EKAMERLATT LSK