Gene Amuc_1799 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Amuc_1799
Symbol
ID	6274674
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Akkermansia muciniphila ATCC BAA-835
Kingdom	Bacteria
Replicon accession	NC_010655
Strand	+
Start bp	2186319
End bp	2187326
Gene Length	1008 bp
Protein Length	335 aa
Translation table	11
GC content	56%
IMG OID	642613863
Product	uncharacterized Fe-S center protein, putative ferredoxin
Protein accession	YP_001878398
Protein GI	187736286
COG category	[R] General function prediction only
COG ID	[COG2768] Uncharacterized Fe-S center protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.160059
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	36
Fosmid unclonability p-value	0.00269064
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGGAAAATA AGATGACGAG AAGAACATGG CTCCAGTCTT CCACCGCAGC CCTGGCATGC 
CTGGCTTTGC CGGAGTATGC CCTGGGCGCG GTTGCGGAGA AGGGTGGAGC TTCCAGGGTC 
TGGATGACGA AGGAAATTTC TCCGGAGGCT CTCGTGAGGA TTTACGAGGC TCTGGGGCGT 
CCGGCCGGGG GAAAGGTAGC TGTCAAGATC AGCACCGGGG AACCGGGAGG CCGCAATTTT 
CTGAGTCCGG CCTTAATCAA AGACCTGGTG CGCCGGGTGA ACGGCACCAT TGTGGAATGC 
AATACGGCTT ACGGAGGCAA ACGCTCCCGG ACGGAGGACC ATTTGCAGGC TGCGAAGGAT 
CACGGTTTTT CCGATATTGC GCGGGTGGAC ATCATGGATG CGGAAGGGGA GTTCACTATC 
CCGGTGAGGG ACAGGAAGCA CCTGGAATAC GATATCGTGG GGGATCATTT AAAGAATTAT 
GATTTCATGG TCAATCTGGC CCATTTCAAA GGGCATGCCA TGGGCGGCTT CGGCGGTGTG 
ATCAAGAACC AGTCCATCGG TGTTGCCTCG GCAGCCGGGA AGGCGTACAT CCATTCCGCC 
GGAAAGACGC GGGATGTTTC CTCCGTGTGG AACAATCTGG CCAGTCAGGA TGATTTCCTT 
GAGTCCATGG CGGCTTCCGC GCAGGCGGTG GCGGATTACT TCGGGGACAG AATTTTGTAC 
ATCAATGTGA TGAATAATCT GTCCATTGAC TGTGATTGCG ATTCCCACCC CCATGCGCCG 
GAAATGAAGG ACATCGGTAT TCTGGCCTCC CTTGATCCGG TTGCTCTTGA CCAGGCCTGC 
CTGGATCTCG TTTACGCCGT CAGGCCGTCC GAAGGGAATG ACAACAGGCC CCTGGTGGCG 
CGTATTGAAA GCCGCCATGG ACGGCATACG GTAGAGTATG CCGAGAAGAT AGGTCTTGGC 
AGCAGGAAGT ATGAACTGAA AGAGCTGAAA CCGCAGCAGG CCGTTTAG

Protein sequence

MENKMTRRTW LQSSTAALAC LALPEYALGA VAEKGGASRV WMTKEISPEA LVRIYEALGR 
PAGGKVAVKI STGEPGGRNF LSPALIKDLV RRVNGTIVEC NTAYGGKRSR TEDHLQAAKD 
HGFSDIARVD IMDAEGEFTI PVRDRKHLEY DIVGDHLKNY DFMVNLAHFK GHAMGGFGGV 
IKNQSIGVAS AAGKAYIHSA GKTRDVSSVW NNLASQDDFL ESMAASAQAV ADYFGDRILY 
INVMNNLSID CDCDSHPHAP EMKDIGILAS LDPVALDQAC LDLVYAVRPS EGNDNRPLVA 
RIESRHGRHT VEYAEKIGLG SRKYELKELK PQQAV