Gene Amuc_1402 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Amuc_1402
Symbol
ID	6275608
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Akkermansia muciniphila ATCC BAA-835
Kingdom	Bacteria
Replicon accession	NC_010655
Strand	+
Start bp	1675473
End bp	1676507
Gene Length	1035 bp
Protein Length	344 aa
Translation table	11
GC content	62%
IMG OID	642613459
Product	hydrogenase expression/formation protein HypE
Protein accession	YP_001878007
Protein GI	187735895
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0309] Hydrogenase maturation factor
TIGRFAM ID	[TIGR02124] hydrogenase expression/formation protein HypE

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.759509
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	62
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTTGAGT GTCCTGTTCC GGAGCCTGTT TCCGACCGTA TCCAGATGGC TCATGGCGGC 
GGAGGCCGCT TGATGAATGA GCTGATCCGT TCCGTGTTTC TGAGCGCCTT CGGGTGCCCT 
TCCGGAGGCG TGCAGAATGA CGCCGCCGTA TTGGAGATTC CTCCGGGGAG GCTGGCGATG 
ACGACGGACA GCTTTGTGGT GCAGCCTTTG GAGTTTCCCG GCGGCTCCAT CGGTTCACTG 
GCGGTGCACG GAACGGTGAA TGATCTCGCC ATGAGCGGCG CGGAGCCGTT GTATTTGACG 
GCGGGCTTTA TTCTGGAAGA AGGGCTTCCG CTGGAAGTTC TGGCCCGCGT GGCACAAGAT 
ATGGCTGCCG CGGCCCGTGC GGCGGGCGTC CGTATTGTGA CGGGGGATAC AAAAGTGGTG 
GAGCGCGGAA AGGGGGACGG CATTTACATT AATACTGCCG GGGTTGGCAT CGTGCGCCAT 
GGGTTGGAGA TCAGCCCTTC TTCCGTTCGT CCGGGGGATT CCGTGCTGCT CAGCGGGGAT 
TTGGGGAGGC ACGGCATGAC GATTATGAGC CTGCGCGCCG GGCTGTCTTT CGGAGACGGC 
CTGGAAAGTG ATTCCGCTCC GTTGCATGAA TCCGTGGCCG CCGTCATTCG TGCCGGCATT 
CCCGTGCATT GCCTGCGTGA CGTGACCCGC GGCGGGTTGA CCGCCACTCT TTCGGAGATT 
GCGGAATCTG CTGGCCTGAC AGTGAAGCTG AATGAAATGT CCATTCCCGT GCGTGAGGAT 
GTCAGGGCGG CGTGCGGGCT GTTGGGGCTG GACCCTCTTC AAGTGGCCTG TGAGGGACGT 
TATCTGGCTG TTCTTCCACG GGAGCATGAG GAAGAGGCCC TGAACCTGAT GCGCGGCTGC 
GGCGTATCTG CCGGAGCCTG CGTCATAGGC CGGGTGGAGG AATTGGGGAC GGCGCCCCTG 
CTGATGACGG GACTTCTTGG AGTGGAGCGG GTGTTGACGA TGCCTTCAGG AATGCAGCTT 
CCCCGCATCT GCTGA

Protein sequence

MFECPVPEPV SDRIQMAHGG GGRLMNELIR SVFLSAFGCP SGGVQNDAAV LEIPPGRLAM 
TTDSFVVQPL EFPGGSIGSL AVHGTVNDLA MSGAEPLYLT AGFILEEGLP LEVLARVAQD 
MAAAARAAGV RIVTGDTKVV ERGKGDGIYI NTAGVGIVRH GLEISPSSVR PGDSVLLSGD 
LGRHGMTIMS LRAGLSFGDG LESDSAPLHE SVAAVIRAGI PVHCLRDVTR GGLTATLSEI 
AESAGLTVKL NEMSIPVRED VRAACGLLGL DPLQVACEGR YLAVLPREHE EEALNLMRGC 
GVSAGACVIG RVEELGTAPL LMTGLLGVER VLTMPSGMQL PRIC