Gene Amuc_1930 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Amuc_1930
Symbol
ID	6275270
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Akkermansia muciniphila ATCC BAA-835
Kingdom	Bacteria
Replicon accession	NC_010655
Strand	-
Start bp	2342372
End bp	2343382
Gene Length	1011 bp
Protein Length	336 aa
Translation table	11
GC content	55%
IMG OID	642613990
Product	transport system permease protein
Protein accession	YP_001878524
Protein GI	187736412
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG4605] ABC-type enterochelin transport system, permease component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.276463
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	45
Fosmid unclonability p-value	0.0688299
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCTGATT CCATTCAACA TCAAAAAGAT GATGCCTTCC GCAATGCTGC CGGCCGGCGT 
CGCGCGTTCC CGGCCTTCCT GATTCTGGGA CTGCTCTGCG TGGGACTGGC GCTCGTATAT 
GTCTTTCAGG GGATGACACC CGAAACGTGG GACTTTAACA TGGCCCGCCG CATTCCCATC 
GTTATTGCGT TGGTGCTGGT TGGAACGGCC GTGGGGCTGT CTTCAGTCGT CTTCCAGACG 
ATCACAACCA ACTATATCCT CACGCCCAGC GTGATGGGGC TCGATAACCT CTACGTATTA 
CTGCAGACGC TCGTGCTCTA CTTCGTGGGC AGCACACAAT TGACGACCAT GCAGAGCCCG 
CTCTGTTTCA TGGGAGCCCT GCTGCTGATG GTCTGCGTAT CTACGGGTAT TTTTTTCTAC 
ATGTTCCGTG GACAGAATGG CGGCAATATT TATTTTGTGG TGTTGGTAGG CATGATCTTC 
GGCATAACCT TCGGAGGCTT GTCGAACTTC ATGCAGGTGC TGATAGATCC GAGCGAATTT 
GCCATACTTG AGGGGCGCCT TTTCGCCAGT TTCAACCGCA TCAATGAAGA ACTGCTGCTT 
ACGGCAGGGC TTGTGATCGC CGCGGCGGTC ATCTGGCTGG TTTGCGACCT CAGGAAGCTC 
GACGTGCTTA CGCTGGGCCG CTCCACGGCC ATTACGCTGG GCGTGAACTA CAAATGGGTG 
GTGCTGCGCT CCCTGATAAT CGTCTCTATT CTGGCCTCGG CCTCGACGGT GCTCGTAGGG 
CCGGTGACTT TCCTGGGCAT TCTCATCGTA AGCATTGCAC GCTTCATATT CCCGACCTAC 
CGCCACATCG TCCTCATGCC CGGCACGGCT CTCGTGGGCG TAGCCGCATT GACTTTCGGC 
ATGCTGCTTA CCGAACGGTG GCTCAACTTC TCCGTGCCCC TGAGCGTAAT CATCAATTTC 
GTTGGCGGGG TTTACTTTAT CTACCTGATC ATGAAAATTA AACGTATATG A

Protein sequence

MPDSIQHQKD DAFRNAAGRR RAFPAFLILG LLCVGLALVY VFQGMTPETW DFNMARRIPI 
VIALVLVGTA VGLSSVVFQT ITTNYILTPS VMGLDNLYVL LQTLVLYFVG STQLTTMQSP 
LCFMGALLLM VCVSTGIFFY MFRGQNGGNI YFVVLVGMIF GITFGGLSNF MQVLIDPSEF 
AILEGRLFAS FNRINEELLL TAGLVIAAAV IWLVCDLRKL DVLTLGRSTA ITLGVNYKWV 
VLRSLIIVSI LASASTVLVG PVTFLGILIV SIARFIFPTY RHIVLMPGTA LVGVAALTFG 
MLLTERWLNF SVPLSVIINF VGGVYFIYLI MKIKRI