Gene Amuc_1675 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Amuc_1675
Symbol
ID	6274481
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Akkermansia muciniphila ATCC BAA-835
Kingdom	Bacteria
Replicon accession	NC_010655
Strand	-
Start bp	2029859
End bp	2030950
Gene Length	1092 bp
Protein Length	363 aa
Translation table	11
GC content	61%
IMG OID	642613734
Product	integrase family protein
Protein accession	YP_001878274
Protein GI	187736162
COG category	[L] Replication, recombination and repair
COG ID	[COG4974] Site-specific recombinase XerD
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	57
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTTTTGA CAAGTTTCGT TATTTTGGGC TTGATGAAGA GTATTATTTA TCCTGTTGCC 
ATGAACACCG ACGCTAGCAC CGCCCTTGCC CTCCTCGCCT CTCTCCCCTT CTCCCTCACC 
GATGTTGCTC GTCTCATGCT GGAGCTGGTC GAAGGAAGCG GAGGCTCTTC CGTAAGAAAG 
AAAGAAGCTC TGCTCCTTCA CTGCCGCCGC GTCATCGCCT TGGGGTGCGA AGCCGAGCAT 
CTCGCCACGC AAACGGTCTC CTTCTCCAAA GCCGTGGCAG AAACCCTGCG CGTCAAGGCC 
GACCGTTCGG CGCTCACCCT GCGCGATATC CGCTCCTTCA CGCAGAGGAT GATGCGAGAT 
GTGCCCGATC TGGCGGCGCG TCCCATGCGC TCGATGACGA CGGCGGACTG TGCGGCTGTG 
TTGGAGAAAG TCTTTCTTTC ACCCTCGCAA CGTCGTCATG CGCGGGCGAT TCTCTCGGGA 
GTGTTCACGG TGGCGTGGAA GAAAGGCTGG TGTGCGCATA ATCCCGTGCG GCTGGTGGAT 
GTGCCGCGCG TGACGGAGCG GGAGATCGTC CCCCTCCGTA TCGAGGAAGT GCGCCGCCTG 
CTGCGGACGG CAGAGAGGGA GGAGTTTTCC CCCTGTGCGG CGGGCGTGGT GATGATGCTC 
TACGGCGGGA TTCGTCCGTA TGAGGTGCGG CGTTTGACCT GGGGCGATGT GGATTGGGAG 
GAGGGGGAGG TGCGGATTCG CCCGAGGCAG AGCAAGACGG GCGGCGGTCG GCAGGTGCCG 
CTGTCTCGCT CCGTGTTGGC ATGGTTGAGG AGTTATTATC CGCAGGGGGC AGAGAGGGAG 
TCGGTTTTCA TCTGTCCGCC AGATTGGAAC AGGCGGTGGC GCGCTTTGCG CTCGGCAGCG 
GGTTTTCAGA CATGGCGTCA GGACGTCCTG CGGCATACCT TTGCGTCGTA TCATGCGAAG 
ATGTTTCACG ATTGGGGGCG TTTGCAGGCG GCGATGGGGC ATCGGGACGG GACGCTGTTG 
CAGACGCGCT ATGTGCATAC GCAGGGGATT CGAGGATGCG AGGTGCGAGC ATTTTGGGAG 
TTGGCGGCGT GA

Protein sequence

MFLTSFVILG LMKSIIYPVA MNTDASTALA LLASLPFSLT DVARLMLELV EGSGGSSVRK 
KEALLLHCRR VIALGCEAEH LATQTVSFSK AVAETLRVKA DRSALTLRDI RSFTQRMMRD 
VPDLAARPMR SMTTADCAAV LEKVFLSPSQ RRHARAILSG VFTVAWKKGW CAHNPVRLVD 
VPRVTEREIV PLRIEEVRRL LRTAEREEFS PCAAGVVMML YGGIRPYEVR RLTWGDVDWE 
EGEVRIRPRQ SKTGGGRQVP LSRSVLAWLR SYYPQGAERE SVFICPPDWN RRWRALRSAA 
GFQTWRQDVL RHTFASYHAK MFHDWGRLQA AMGHRDGTLL QTRYVHTQGI RGCEVRAFWE 
LAA