Gene AnaeK_1999 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	AnaeK_1999
Symbol
ID	6786027
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaeromyxobacter sp. K
Kingdom	Bacteria
Replicon accession	NC_011145
Strand	+
Start bp	2250785
End bp	2252488
Gene Length	1704 bp
Protein Length	567 aa
Translation table	11
GC content	71%
IMG OID	642763457
Product	Mammalian cell entry related domain protein
Protein accession	YP_002134356
Protein GI	197122405
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG1463] ABC-type transport system involved in resistance to organic solvents, periplasmic component
TIGRFAM ID	[TIGR00996] virulence factor Mce family protein

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGAAGCCCG CCGTCAACAA GGCCCTCGCC GTGGGCGTGC TCGTCGCCGT CGGCCTGGCG 
GCGTTCCTGT TCGCGTTCAC CTTCTTCAAG AAGGGCGGGT ACTCCGAGGC GGACAGCTAC 
CTCGTGTACG CGCGGTTCAG CGACGCCACC GGCCTCACCT GGAAGAGCAA GGTGCAGATC 
GCCGGCATCC AGGTGGGCGA GGTCGCGAAG ATCTCGCTCG ACAAGAACAA GGCGCTGCTC 
CAGATCCGCA TCGACCGCTC GGTGCCGCTC CACACCGACG CCTGCCTCTA CAAGAGCTTC 
CCGTCCGCGC TGCTCCCCGA CGCGCTGCTC GAGGTCATCG CCGGCTCCGA CGCCGCGCCG 
CTCCTCTCGT CGCTGCCGGA GGCCGAGCGC GAGATCAAGT GCGTGCGCGA GGCCACCAGC 
GTGCAGCAGC TGCTCGACTC GATGGCGAAG ATCGCCAGCG ACGTGCAGCT CGTCACCGGC 
GACCTCGCCA AGACCGTCCA GGGCGACCAG GGCAGCCTGC GCGAGATCGT GGAGAACCTG 
GCCCGCATCA CGCGCCAGGT CGATCAGGTG GTGGCGCAGA ACAGCGCCAA CCTCTCCGAG 
CTCATCGCGA ACACCCGCGA CTTCACCGCC GACCTGCGCG AGATCTCGGC GCGCGACAAG 
GACCGCATCC ACAGCATCCT CGCGAACGTG GACGAGCTCA CCGCGCGCCT GAAGGTCGCC 
GCGGGCAGCC TGCAGGGCAT CCTCGACGGC GGCGGCTCCG GCGCTCCGGG CGGCGGTCCG 
CCCGGCGCTC CCGGCGCTCC CGGCGCCCCG GGAGCACCTG GCGCACCCGG CGCGCCCGGC 
ACCGCGGGCG CGACGCCGGC GGTCGCCAGC CAGCAGGCGC AGGCGAAGGG CGTGCAGCAG 
GCGGTGGCGC GCCTCAACGA CAGCCTCTCC CGGCTCGACC AGCTCCTCGC CAAGGTCCAG 
GAGGGGAAGA GCGTCGCCGG CCGGCTCCTC ACCGACGAGA AGATGGGCCG CCAGCTCGGG 
ACCGCGGTGG AGGGCGTCTC GGACTACGTG GACCGGCTGC AGAAGATGCA GATCGAGGTC 
CAGCTCCGCT CCGAGTGGCT GCTCAACCAG AGCGTGGAGG ACGGCCGCCC CGGCGCGAAG 
GTCTACTTCG GCGCGAAGCT GCTGCCGCGC CCGGACAAGT ACTACCTGCT CGAGGTGGTG 
AGCGATCCGC GCGGCGTGGA CACGGTCACG ACCGACACCA TCACCACCCG CACGCCGGGC 
TCGGTCGGCG ACTCGACCAC GGTCACCACC CGGACCCGGC ACGAGGACAA GGTCACGTTC 
TCGCTGCAGA TGGCGAAGCG CTACGGCCCG GTCACGTTCC GCGGCGGCGT CATCGAGAGC 
TCCGGCGGCC TCGGCGCCGA CCTGCACCTC ATGAAGGACC GGCTCCAGAT CTCCACGTCG 
CTCTACCAGT TCTCGCGGCC GTACCAGGAC GTGTTCCCGC GCGCCAAGGT CTGGGCGAAC 
TACAACTTCC TGCAGCACTT CTACGTCACC ACCGGCGTCG ACGACTTCCT GAACCGGTGG 
CGCAGCGCCG CCTCGCCCGA CGGCCGCAGC TTCAACATCG GCACCGACGT GTTCTTCGGC 
GCGGGCCTCT ACTTCACCGA CGACGACCTG AAGACGCTGC TCGTCTCGGG CGCCGGCAGC 
GCCGCGAGCG GCGCCGGCAA GTAG

Protein sequence

MKPAVNKALA VGVLVAVGLA AFLFAFTFFK KGGYSEADSY LVYARFSDAT GLTWKSKVQI 
AGIQVGEVAK ISLDKNKALL QIRIDRSVPL HTDACLYKSF PSALLPDALL EVIAGSDAAP 
LLSSLPEAER EIKCVREATS VQQLLDSMAK IASDVQLVTG DLAKTVQGDQ GSLREIVENL 
ARITRQVDQV VAQNSANLSE LIANTRDFTA DLREISARDK DRIHSILANV DELTARLKVA 
AGSLQGILDG GGSGAPGGGP PGAPGAPGAP GAPGAPGAPG TAGATPAVAS QQAQAKGVQQ 
AVARLNDSLS RLDQLLAKVQ EGKSVAGRLL TDEKMGRQLG TAVEGVSDYV DRLQKMQIEV 
QLRSEWLLNQ SVEDGRPGAK VYFGAKLLPR PDKYYLLEVV SDPRGVDTVT TDTITTRTPG 
SVGDSTTVTT RTRHEDKVTF SLQMAKRYGP VTFRGGVIES SGGLGADLHL MKDRLQISTS 
LYQFSRPYQD VFPRAKVWAN YNFLQHFYVT TGVDDFLNRW RSAASPDGRS FNIGTDVFFG 
AGLYFTDDDL KTLLVSGAGS AASGAGK