Gene Amuc_0058 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Amuc_0058
Symbol
ID	6275102
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Akkermansia muciniphila ATCC BAA-835
Kingdom	Bacteria
Replicon accession	NC_010655
Strand	+
Start bp	76891
End bp	77946
Gene Length	1056 bp
Protein Length	351 aa
Translation table	11
GC content	59%
IMG OID	642612101
Product	ATP:guanido phosphotransferase
Protein accession	YP_001876685
Protein GI	187734573
COG category	[E] Amino acid transport and metabolism
COG ID	[COG3869] Arginine kinase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.00335671
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	47
Fosmid unclonability p-value	0.178856
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTCTTTG ACGACTTACT CAACAACCCC GCCAAATGGA TGGTGGAATC AAGGGATGAG 
CACGACATCG TCCTCACCTC CCGCATCCGC CTGGCGCGCA ACCTGACCGC CACCCCCTTT 
CCCGGCTGGG CCACACGCCA GCAGAGGGAG GAAACGCTGA AGCTCACTTC CGGAGAAGCG 
CGCCAAATCC CCGTCATGAA GGGAGGCTAT TATGCGGAGC TCTCCGGACT TACCCAGCAG 
CAGAAACAGT TGCTGGTGGA ACGCCACCTC ATTTCCCGGG AACTGGCGGC GCGTTCGGAA 
GGCTGCGCCG TCCTCATCTC CCGCAGCCAG AATGCCAGCA TCCTCTTTAA TGAGGAAGAC 
CATCTGCGCC TGCAGTATAT CCTGCCCGGC ATCCAGCTTA AAAAAGCATG GGGGGCCATC 
TCCAAAATAG ACTCCGAACT GGAGGCCAGG CTCCCATACG CCTACAATAC GCGGCTGGGC 
TACATTACCG CCTGTCCCAC CAACCTGGGC ACGGGCATGA GGGCCTCCGT GATGATGCAT 
CTGCCAGGCC TCGTCATCTC CGAACAGATG CAGCAGGTCG TTCAGGCGGC CGCGCAGCTC 
AACATTACCG TCCGCGGCCT TTACGGGGAA GGGACGGAAG CCACCGGTAA CCTTTTCCAG 
ATATCCAACC AGTCCACGCT GGGGGACAGT GAAGACCAGA TTGTGGAACG CATGACCCGC 
TTCACCTCCG ACCTGGCCCA TCAGGAATGG AACGCACGCA GGCGGCTGCT CCAGTCATCT 
TCCCTGCAGG TGAAGGACCG CGTTTCCCGC GCCTACGGCC TTCTGACCAA TGCCACTCTG 
CTTTCCACGC AGGAGGCGCT GGCCCTGCTC TCCTTCCTCC GGATGGGAGC GTCTCTGGAC 
ATCTTTTCCC ACCAGGCATT AAAAAACGTC AATAAAACCA TCATGAACAT CCAGCCGGCC 
CATCTGGCCC GCCTGTCCAC CACGGACCAA ACCACTCCGG AACACAGGGA CCAGATCCGC 
GCTGATATTA TTCGGAAAGA ACTTTCCGGC AACTAA

Protein sequence

MLFDDLLNNP AKWMVESRDE HDIVLTSRIR LARNLTATPF PGWATRQQRE ETLKLTSGEA 
RQIPVMKGGY YAELSGLTQQ QKQLLVERHL ISRELAARSE GCAVLISRSQ NASILFNEED 
HLRLQYILPG IQLKKAWGAI SKIDSELEAR LPYAYNTRLG YITACPTNLG TGMRASVMMH 
LPGLVISEQM QQVVQAAAQL NITVRGLYGE GTEATGNLFQ ISNQSTLGDS EDQIVERMTR 
FTSDLAHQEW NARRRLLQSS SLQVKDRVSR AYGLLTNATL LSTQEALALL SFLRMGASLD 
IFSHQALKNV NKTIMNIQPA HLARLSTTDQ TTPEHRDQIR ADIIRKELSG N