Gene Amuc_0957 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Amuc_0957
Symbol
ID	6274206
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Akkermansia muciniphila ATCC BAA-835
Kingdom	Bacteria
Replicon accession	NC_010655
Strand	-
Start bp	1142034
End bp	1143329
Gene Length	1296 bp
Protein Length	431 aa
Translation table	11
GC content	58%
IMG OID	642613011
Product	NusA antitermination factor
Protein accession	YP_001877570
Protein GI	187735458
COG category	[K] Transcription
COG ID	[COG0195] Transcription elongation factor
TIGRFAM ID	[TIGR01953] transcription termination factor NusA

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	65
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACAAACG ATATTAAAGC TTTGATTGAC TACTACGAGA GGGAAAAAGG GCTCTCCCGT 
GAAAAAATTC TCCTCGCTCT GGAGTCCGCC TTTCTCTCCG CCTACCGCAA AATGGTTCCC 
GGTTCCGGCA GCATCAACTA CCTGAGGGCC GAAATCAACG TGGACAAGGG CAAGGTGCGT 
ATTTTTGCGG ACCTGGAAGT GGTGCCGGAT GAAGAATATT CCGACAAATT CAACCAGATC 
CCCCTTTCCC TGGCCGTCAA GCTGGACAAA AACGCCGTGC TTCACGACCT GCTCCCCACC 
AACATCACGC CCAAGGGCTT CGGCCGCATC GCGGTGCAGA CCGCCCGCCA GACCATGCTC 
CAGAAACTGC TGGATGCGGA AAAGGAAATG CTCTACGACG AATTCAAGGA CCGCGCCGGA 
GATCTGGTAA CGGGCACCAT CCGCCGTTTT GAAAAGGGGG ATATTTTTGT GGACCTCGGC 
AAATTCGAAG GCGTCATGAC CTCCCGCGAA CGCGTGCCGA ATGAAGACTA CAGCGTCGGC 
GACCGCATGC GCTTCTACGT GGTGGAAGTG CGCACGGAAG CACGCGGCCC GGAAGTCATC 
CTTTCCCGCA GCCATCCGAA CCTGGTGCGC CGCCTCTTTG AATCGGAAGT GGTGGAAATA 
GGCGACCAGA CCGTGGAAAT CCACGGCATC GCCCGCGAAG CCGGCTACCG CACCAAAGTG 
GCCGTCATCA GCCATGACGA CAAAGTAGAT CCGGTAGGGG CATGCGTAGG CATGCGCGGC 
GCCCGCGTCA AAAACATCGT CCGGGAGCTC AACAATGAAA AAGTGGACAT CCTGGAATGG 
ACGGAAGACC CCGTCACCTT CGTCCGGGAA GCTCTCAGCC CCGTGGAACC GCGGGAAATC 
ACCGTGGACG AGGAAGCCAG AAAAATCTTC GTTATCGTCC AGGACGACAA AGACCTCTCC 
AAGGCCATCG GCCGCAGGGG CCAGAATGCC CGCCTCACCT CCCGCCTGAT GGGCTGGGAT 
GTCCAGGTGC GCGTCTTTGA TGTCCAGGAA GCGGAAAAAC GCCAGAGCCA GGCTGCGGCC 
GAAGAAGTCA TGCGCCAATG CCAGGCTGCG GCCAAAACCC TCAGCGAACA ATTGGAAATC 
CCGGAAGAAA CCGCCATGGG CCTGGTGACC ATGGGCGGAA CGGACCTGGT GGCCCTCACC 
GGATTTGAAG CTTCCGACAT CGCGGAAAGC ATGGGCATTC CCGCAGAGGA AGCCGCCCAA 
ATTCTGGACA AGGCCCGGGA CCTTATCTCC CAATAA

Protein sequence

MTNDIKALID YYEREKGLSR EKILLALESA FLSAYRKMVP GSGSINYLRA EINVDKGKVR 
IFADLEVVPD EEYSDKFNQI PLSLAVKLDK NAVLHDLLPT NITPKGFGRI AVQTARQTML 
QKLLDAEKEM LYDEFKDRAG DLVTGTIRRF EKGDIFVDLG KFEGVMTSRE RVPNEDYSVG 
DRMRFYVVEV RTEARGPEVI LSRSHPNLVR RLFESEVVEI GDQTVEIHGI AREAGYRTKV 
AVISHDDKVD PVGACVGMRG ARVKNIVREL NNEKVDILEW TEDPVTFVRE ALSPVEPREI 
TVDEEARKIF VIVQDDKDLS KAIGRRGQNA RLTSRLMGWD VQVRVFDVQE AEKRQSQAAA 
EEVMRQCQAA AKTLSEQLEI PEETAMGLVT MGGTDLVALT GFEASDIAES MGIPAEEAAQ 
ILDKARDLIS Q