Gene Ajs_2472 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ajs_2472
Symbol
ID	4672234
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Acidovorax sp. JS42
Kingdom	Bacteria
Replicon accession	NC_008782
Strand	+
Start bp	2631584
End bp	2632741
Gene Length	1158 bp
Protein Length	385 aa
Translation table	11
GC content	70%
IMG OID	639839540
Product	tetratricopeptide repeat protein
Protein accession	YP_986709
Protein GI	121594813
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2956] Predicted N-acetylglucosaminyl transferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.251188
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	0.3368
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAATTTG ACCTGAGCTG GATCTTCCTG GGGCTGCCGC TGGCCTTCGG GCTGGGGTGG 
TTCGCCTCGC GTTTCGACCT GCGGCAGATG CGCGAGGAGA ACCGCCGCGC ACCCAAGGCT 
TACTTCAAGG GCCTGAACTA CCTTCTCAAC GAGCAGCAAG ACCAGGCCAT CGATGCCTTC 
ATCGAGGCGG TGCAGAACGA CCCTGACACC ACCGAACTGC ACTTCGCCCT GGGCAACCTG 
TTTCGCCGCC GCGGCGAGTA CAACCGCGCC GTGCGGGTGC ACGAGCACCT GCTGTCGCGC 
GGCGACCTGA GCCGCGCCGA CCGCGAGCGC GCACAGCATG CGCTGGCGCT GGACTTCCTC 
AAGGCAGGCC TGCTCGACCG CGCGGAAGAC GCACTGCGCC GCCTGGAGGG CAGCGCCTTC 
GAGGGCCAGG CACGCATGGC CCTGCTGGCC ATTTACGAGC GTTCGCGCGA CTGGCCACAG 
GCGTCGGACA TTGCACGGCG CATGCACCAT GCGCAGCAGG GCGACTTCAG CACCCGGCTG 
GCGCACTACC TGTGCGAGCA GGCGCTGGCG CTGGCAGCCC ATGGCGAACT GCCCGCCGCC 
CAGGCGCTGC TGGAGCAGGC CCTGGCCACG GCGCCCCAGG CGCCGCGCGC GCGCATCGAG 
CTGGCGCGGC TGCAGCAGCG CCAGGGCCAG CCCGAAGCGG CCTTCGACAC CCTGCAAGCG 
CTCGCCCAGG CCGCACCCGC CGCGCTGCCG CTGGCCGCAC CGCTGCTGGT GGAGACCGCC 
ACCGCCACGG GACAAGCGCC GCAGGCCCAG GCGCTGCTGC AGCACCACTA CGAGGACATG 
CCATCCCTGG ATCTGCTGGA AGCCGTGGTG GCGCTGGAGG CTGCCAACGC GAACACTGCG 
GCCGTTGGGC GCGAGTGGTA CGTGCGCCAC CTGGAGCGCG AGCCCTCCCT GGTCGCCGCG 
ACGAAGTGGC TGGCAGGCGA GACGCTGACC CATGAGCAGT TCCACCCGCA GATCCAGCGC 
GCGCTGGAGC AGGCGGCAAA GCCGCTCACG CGCTACCGCT GCGCAGCCTG CGGGTTCGAG 
GCACGCCAGC ACTTCTGGCA ATGCCCGGGC TGCCAGACCT GGGACAGTTA TCCGGCACGG 
CGCGTCGAGG AGCTGTAG

Protein sequence

MEFDLSWIFL GLPLAFGLGW FASRFDLRQM REENRRAPKA YFKGLNYLLN EQQDQAIDAF 
IEAVQNDPDT TELHFALGNL FRRRGEYNRA VRVHEHLLSR GDLSRADRER AQHALALDFL 
KAGLLDRAED ALRRLEGSAF EGQARMALLA IYERSRDWPQ ASDIARRMHH AQQGDFSTRL 
AHYLCEQALA LAAHGELPAA QALLEQALAT APQAPRARIE LARLQQRQGQ PEAAFDTLQA 
LAQAAPAALP LAAPLLVETA TATGQAPQAQ ALLQHHYEDM PSLDLLEAVV ALEAANANTA 
AVGREWYVRH LEREPSLVAA TKWLAGETLT HEQFHPQIQR ALEQAAKPLT RYRCAACGFE 
ARQHFWQCPG CQTWDSYPAR RVEEL