Gene Ajs_4012 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ajs_4012
Symbol
ID	4671795
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Acidovorax sp. JS42
Kingdom	Bacteria
Replicon accession	NC_008782
Strand	+
Start bp	4271170
End bp	4272879
Gene Length	1710 bp
Protein Length	569 aa
Translation table	11
GC content	72%
IMG OID	639841052
Product	protein of unknown function DUF894, DitE
Protein accession	YP_988192
Protein GI	121596296
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	30
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCGCCCC AGCCCCTCCA TGACAGCGGA CCGCTGAGTT CACAGCCCAC GCCGCCAGGC 
CCCGACGCGG CCTCCGCCGC CGCCCACACC GCCGAGGCCG CAGCCACAGC CGAGTTGCAG 
CACAGCGCGG CGCAGCGTGC GCCGCAGTCG CCCTTCGCGC CGCTGTCGGT GCCGGTGTTC 
CGCATGCTGT GGCTCACCTG GCTGGCGGCC AACACCTGCA TGTGGATGAA CGACGTGGCC 
ACGGCCTGGC TGATGACCAC GCTGACCGAT TCGCCTGCCC TGGTGGCGCT GGTGCAGACG 
GCCTCGACGC TGCCCGTGTT CCTGCTGGGC TTGCCCAGCG GCGCGCTGGC CGACATCCTG 
GACCGGCGGC GCTATTTCAT GGTCACGCAG TTTTGGGTGG CGGCCGTGGC GGTGGTGCTG 
TGCGTGGCCA TCCTCTGGGG TGGGCTCAAC CCCTACCTGC TGCTGGCGCT GACGTTCGCC 
AACGGCATCG GGCTGGCGAT GCGCTGGCCG GTGTTTGCGG CCATCGTGCC GGAGCTGGTG 
AACCGCCAAC AGTTGCCCGC GGCGCTGGCG CTCAATGGCG TGGCCATGAA CGCCTCGCGC 
ATCATTGGCC CGCTGGTGGC CGGCGCCATC ATCGCCAGCG CGGGCAGCGC CTGGGTGTTC 
GTGCTGAATG CCGTGCTGTC GCTGGTGGCG GGGTTCACCA TCATGCGCTG GCGGCGCCAG 
CCCATGCCCA ACCCGCTGGG GCGCGAGCGC CTGACCAGTG CCATGCGCGT GGGTCTGCAG 
TTCGTGCGCG AGTCGCCCCC GATGCGCGCC GTGCTGTGGC GCATCTCGAT CTTCTTCCTG 
CATGCCACGG CGCTGCTGGC GCTGCTGCCG TTGGTGGCGC GCGACCTGCA GGGCGGCGGC 
GCGGGCACCT TCACGCTGCT GCTGGCCTCC ATGGGCGCGG GCGCCGTGAG CGCTGCCATG 
TTCCTGCCGC GCCTGCGCCA GATGATGTCG CTGGACCAGC TGGTGGCGCG CGGCACGCTG 
CTGCAGGCGC TGGCCACGGC CGTGGTCGCC ATTGCGCCCA ACGTGTACGT GGCGGTGCCG 
GCCATGCTGG TCGGCGGGGC GGCGTGGATC ACCACCGCCA ATTCGCTCAC GGTGGCCGCA 
CAGCTGGCGC TGCCCAACTG GGTGCGCGCG CGCGGCATGT CCATCTACCA GATGTCCATC 
ATGGGCGCCA CGGCCGTGGG CGCGGCGCTG TGGGGGCAGG TCGCCGCACT CTCCAGCGTG 
CACATGAGCC TGGCATTGGC GGCACTCACC GGGGTGCTGG TGATGGCGCT GGTACAGCGC 
CTGGTGAGCA ACCGCCATGG CGAGGAGGAC CTGAGCGCCT CGCGCGCCTT CCAGGCACCG 
CGGGCCGACA GCCCGCCCGC CGCCGGCCTG CGGCTGGTGG TCAGCATCGA ATACTTCATC 
AACCCCGCAC GGGCGGCGGA ATTTCGCGCC GTGATGCAGG AAAGCCGCCG CGCGCGCCTG 
CGCCAGGGCG CCTTGAGCTG GGAGCTGCAG CACGACATCG CCGACCCGCG CCGCTACGTG 
GAGCGCGTGG TGGACGAATC CTGGACGGAG CACCTGCGGC GCTTTGACCG CGTCACCGCC 
TCCGACGTGG CGCTGCGCGA CAGGCGCTTT GCCTTCCACG TGGGCGACGC GCCGCCCGTG 
GTGTCGCGCT ACGTGGTCGA GGGCGAATGA

Protein sequence

MPPQPLHDSG PLSSQPTPPG PDAASAAAHT AEAAATAELQ HSAAQRAPQS PFAPLSVPVF 
RMLWLTWLAA NTCMWMNDVA TAWLMTTLTD SPALVALVQT ASTLPVFLLG LPSGALADIL 
DRRRYFMVTQ FWVAAVAVVL CVAILWGGLN PYLLLALTFA NGIGLAMRWP VFAAIVPELV 
NRQQLPAALA LNGVAMNASR IIGPLVAGAI IASAGSAWVF VLNAVLSLVA GFTIMRWRRQ 
PMPNPLGRER LTSAMRVGLQ FVRESPPMRA VLWRISIFFL HATALLALLP LVARDLQGGG 
AGTFTLLLAS MGAGAVSAAM FLPRLRQMMS LDQLVARGTL LQALATAVVA IAPNVYVAVP 
AMLVGGAAWI TTANSLTVAA QLALPNWVRA RGMSIYQMSI MGATAVGAAL WGQVAALSSV 
HMSLALAALT GVLVMALVQR LVSNRHGEED LSASRAFQAP RADSPPAAGL RLVVSIEYFI 
NPARAAEFRA VMQESRRARL RQGALSWELQ HDIADPRRYV ERVVDESWTE HLRRFDRVTA 
SDVALRDRRF AFHVGDAPPV VSRYVVEGE