Gene Amuc_1096 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Amuc_1096
Symbol
ID	6274005
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Akkermansia muciniphila ATCC BAA-835
Kingdom	Bacteria
Replicon accession	NC_010655
Strand	-
Start bp	1308450
End bp	1309874
Gene Length	1425 bp
Protein Length	474 aa
Translation table	11
GC content	57%
IMG OID	642613147
Product	transcription termination factor Rho
Protein accession	YP_001877703
Protein GI	187735591
COG category	[K] Transcription
COG ID	[COG1158] Transcription termination factor
TIGRFAM ID	[TIGR00767] transcription termination factor Rho

Plasmid Coverage information

Num covering plasmid clones	1
Plasmid unclonability p-value	0.00000220234
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	27
Fosmid unclonability p-value	0.0000128314
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGACTGAAG AACTCGACAA CACCCCTTCC CCCGCCGGAG ATATTCCGCA GGAAACCCTC 
CCCAAGCCCC TGCCCGCGCC GGAAGAAACC GCCGGGGAAC AGCCGGCTGC CGCTCCGGAG 
GAAAATAGAG GAAACGCAGT CCGGGAGGAG GAGGAAGCAG CCCCTGTTCT GGAGCAGATT 
GACATCAATG AACTGCGGAA ACGCCCCCTG AACGATCTTC AGGAAATGGC GGAAGGGCTG 
CCCATCCGGA ACGCGGCCTC CCTCACCAAG TCCCAGCTGG TTTTTGAATT GGGGAAACAG 
CTTCTGGCAA AGGGCCATGA AGTCGTAGTT TCCGGGGTCA TGGAACAAGC CAAGGATAAT 
TACGCCATGC TGAGGGATCC GGTGAAAAGT TTCCGCACCT CTCCGGATGA TATTTATCTG 
GGCGGCAATC TCATCAAACC CCTGCATCTC CGCGTAGGCC AGCAGATCAA GGTCAGGCTG 
CGCAAATTGC GGCCTCATGA CAAGTACCTT TCTGCAGCCT CCGTCATCAG CGTGGAGGAC 
ATCCCTGCGG AAGACTACCG GGCGCGCAGC GATTTTGAAC GCCTCACCCC CCTCTTCCCC 
AAGGAACGCC TCCTTCTGGA AAACAAGGGG GTCAATTCCG CCGCCATGCG CGTGCTGGAC 
CTCATGACGC CCTTCGGCAA AGGGCAGCGC GGCCTGATTG TGGCCCCCCC GCGCGGAGGA 
AAAACCGTTC TTCTGAAAAC AATCGCCCGT TCCATCAGGG CCAATTATCC GGAAGTGGAA 
CTGATTGTGC TGTTGCTGGA CGAACGTCCG GAGGAAGTAA CGGATTTTGA AGAAACCGTG 
GATGCTCCGG TATTCGCCTC CACTTTTGAC GAACCTTCCC GGCGCCATGC CCAGGTTTCC 
GATCTGGTTA TCGAACGGGC CAAACGCCTG GTGGAAATGG GCAGAGACGT CGTCATCCTG 
CTGGATTCCC TCACCAGGCT GGCCCGCGGC TACAATGCCA ACCAGACGGG AGGACGCATC 
ATGTCCGGCG GCCTGGGGTC CAATGCATTG GAAAAACCGC GCAAATTCTT TTCCGCGGCG 
CGCAATGTGG AAGAAGGAGG CAGCCTGACC ATCATCGCCA CATGCCTGGT AGACACGGAA 
TCAAGAATGG ACGAAGTGAT TTTTGAAGAA TTCAAGGGAA CGGGCAATCT GGAAATCCGC 
CTGGACCGGG AACTTTCCGA ACGGCGCATT TATCCGGCCA TTTCCCTTTC CCAGAGCGGC 
ACCCGCAATG ACGACAGGCT GTATAACGAA CAGGAATTCG TCAAAATCAT GCAATTGCGC 
CGCCAGCTCG CCATGAAACC GGGCTGGGAA GGCCTTCAGA CTCTCCTGCA AAATATCTCC 
AAGACACAGA ATAACGCGGA ACTTCTGCTG ACGGGGCTGC GGTAA

Protein sequence

MTEELDNTPS PAGDIPQETL PKPLPAPEET AGEQPAAAPE ENRGNAVREE EEAAPVLEQI 
DINELRKRPL NDLQEMAEGL PIRNAASLTK SQLVFELGKQ LLAKGHEVVV SGVMEQAKDN 
YAMLRDPVKS FRTSPDDIYL GGNLIKPLHL RVGQQIKVRL RKLRPHDKYL SAASVISVED 
IPAEDYRARS DFERLTPLFP KERLLLENKG VNSAAMRVLD LMTPFGKGQR GLIVAPPRGG 
KTVLLKTIAR SIRANYPEVE LIVLLLDERP EEVTDFEETV DAPVFASTFD EPSRRHAQVS 
DLVIERAKRL VEMGRDVVIL LDSLTRLARG YNANQTGGRI MSGGLGSNAL EKPRKFFSAA 
RNVEEGGSLT IIATCLVDTE SRMDEVIFEE FKGTGNLEIR LDRELSERRI YPAISLSQSG 
TRNDDRLYNE QEFVKIMQLR RQLAMKPGWE GLQTLLQNIS KTQNNAELLL TGLR