Gene Apar_0189 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Apar_0189
Symbol
ID	8413037
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Atopobium parvulum DSM 20469
Kingdom	Bacteria
Replicon accession	NC_013203
Strand	+
Start bp	223435
End bp	225024
Gene Length	1590 bp
Protein Length	529 aa
Translation table	11
GC content	52%
IMG OID	645021761
Product	GMP synthase, large subunit
Protein accession	YP_003179216
Protein GI	257783999
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0519] GMP synthase, PP-ATPase domain/subunit
TIGRFAM ID	[TIGR00884] GMP synthase (glutamine-hydrolyzing), C-terminal domain or B subunit [TIGR00888] GMP synthase (glutamine-hydrolyzing), N-terminal domain or A subunit

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.0433911
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTGAGT CCAGGCCCAA GCAGTTTGTT GCAGTTCTAG ACTTTGGTGC CCAGTACGGC 
CAGTTAATTG CACGTCGCGT GCGCGATCTT AACGTCTACT CCGAGATTGT TCCTTGTGAT 
ATTTCCGCAG ATGAGCTTCG TGAGCTTAAT CCATCTGCGC TTATTTTGTC CGGCGGCCCT 
GCTTCCGTTT ACGCCGAGGA CGCGCCAAAG ATTGACCCAG AGATTCTGGA GCTTGGTATT 
CCTGTCTTTG GTTTCTGCTA TGGACAGCAG ATTATGGCGG TTACCCTGGG CGGCACTGTT 
GGACATACCG AGAAGGGCGA GTATGGCCCA GCTCATCTGA CTCGTGCAGG GGAGAGTCGT 
ATTTTTGACG GCACCGCTGA GCAGCAGACC GTTTGGATGA GCCACCGCGA CGCTGTCTCT 
GAGGTTCCAG ATGGCTTTAC CGTTACCGCT TCTACCGACG TTTGCCCTAT TGCAGCTATG 
GAAAACGCTG CTAAGAATCT ATATTCAACT CAGTTTCATC CAGAGGTCAA CCACACCGAA 
TGTGGTTCCC AGATGCTTTC TAACTTTCTA TTTAATATCT GTGGCTTTGA AAAGACTTGG 
ACTATGGACA ACATCATTGA GCAGAAAGTG GAGGAGATTC GCCAGAAGGT TGGTAATGGA 
CGTGTCATTT TGGCGCTCTC CGGTGGCGTA GACTCTTCCG TTGTTGCCGC TCTTGTCCAT 
CGTGCTATTG GTGATCAGCT GACCTGCGTG TTTGTCAATC ACGGTATGCT TCGTAAGGGC 
GAACCAGAGA TGGTTGAGCA GGTCTTCTGC AAGCAGTTTA ACGTGCCTTT GATTCACGTT 
CACGCGGAGG AGCGCTACGC AGAGCTTTTA GCTGGCGTTA CTGAGCCAGA GAAGAAGCGT 
CGTCTGATTG GTACCGAGTT CTGGAAGGTC TTCTTTGATG AGGCTCAGAA GCTGGATGGC 
GTTCAGTTCC TGGCACAGGG CACCATTTAT CCTGACATTA TTGAGTCTGG CGCTCGTAAG 
ACGGGCGGTA AGGCTGCAAC CATCAAGAGC CACCACAACC TGATTCCATT CCCAGAAGGC 
GTTCACTTTG ACCTGATTGA GCCTCTGGAT CACTTCTTCA AGGACGAGGT CCGCGCGCTG 
GGCGTTTCTC TTGGTCTGCC AGAGAACCTT GTCTACAGAC AGCCTTTCCC AGGTCCTGGT 
CTTGCTATCC GCATCATTGG TGACGTTACC CCAGAAAAGC TGGAAATTCT TCGCAACGCA 
GATGCAATTG TCCGAGAAGA GATTGACGCT TACAATGCTC AGCTCTTTGA CGAGACAGGC 
GATCGTAACT CCGAGCACAG TGTTTGGCAG TACTTTGCTG TGCTACCCGA CATTAAGTCC 
GTTGGTGTTA TGGGTGATGA GCGCACGTAT GCTCGTCCAG TTATCCTGCG CGCCGTTGAG 
TCCAGTGACG CTATGACCGC TGACTGGGCA AAGCTCCCAT ATGAGCTGCT AACTCGCATT 
TCTTCTAGGA TTGTTAGCGA GGTTGCTGGT GTTAACCGCG TAGCATACGA CATTACTCCT 
AAGCCACCTG CGACTATTGA GTGGGAGTAG

Protein sequence

MSESRPKQFV AVLDFGAQYG QLIARRVRDL NVYSEIVPCD ISADELRELN PSALILSGGP 
ASVYAEDAPK IDPEILELGI PVFGFCYGQQ IMAVTLGGTV GHTEKGEYGP AHLTRAGESR 
IFDGTAEQQT VWMSHRDAVS EVPDGFTVTA STDVCPIAAM ENAAKNLYST QFHPEVNHTE 
CGSQMLSNFL FNICGFEKTW TMDNIIEQKV EEIRQKVGNG RVILALSGGV DSSVVAALVH 
RAIGDQLTCV FVNHGMLRKG EPEMVEQVFC KQFNVPLIHV HAEERYAELL AGVTEPEKKR 
RLIGTEFWKV FFDEAQKLDG VQFLAQGTIY PDIIESGARK TGGKAATIKS HHNLIPFPEG 
VHFDLIEPLD HFFKDEVRAL GVSLGLPENL VYRQPFPGPG LAIRIIGDVT PEKLEILRNA 
DAIVREEIDA YNAQLFDETG DRNSEHSVWQ YFAVLPDIKS VGVMGDERTY ARPVILRAVE 
SSDAMTADWA KLPYELLTRI SSRIVSEVAG VNRVAYDITP KPPATIEWE