Gene Achl_1779 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Achl_1779
Symbol
ID	7293239
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter chlorophenolicus A6
Kingdom	Bacteria
Replicon accession	NC_011886
Strand	-
Start bp	2011721
End bp	2013364
Gene Length	1644 bp
Protein Length	547 aa
Translation table	11
GC content	66%
IMG OID	643590187
Product	extracellular solute-binding protein family 5
Protein accession	YP_002487847
Protein GI	220912538
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0747] ABC-type dipeptide transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.000000000000779401
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGACCCCCA TCGAATTCCG CCGCCGCGCC TTCCTGGCCG GCATCACCGC CATCACCGGT 
TCCGCCGTCC TCACCGCATG CGGCGGCCCC TCGGCCACCA GTTCCTCCGA CGCCGGCACG 
CCGGTTGACG GCGGAAACAT CACCTTCCTC ATCCAGGGCT ACGACACCGG CTGGGTCTCG 
AGCAAGACGT CCATTTCCAG CTACGAGGGC AACCTCTGGG GCCAGATCAC CGACAAGCTG 
GTCTACGTAG ACGACAAAGG CCAGCTCAGC CCCTGGGTGG CCGAAAGCTG GGAGGAACTC 
AACGGCGCCA AGGATTTCGT CCTGCACCTC AAAGACGGAG TGACTTTCTC CGACGGCACG 
CCCCTGGACG CGGCCGCCGT CGTGGCCAAC CTCAACGCTT GGGCCAAGGG GGCCCCGGAC 
CGCGGCGTCA GCAAGGTGGG CCTCTTCCCG TCCAGCAACT TCGCCAGCGC GGAGGCCGCC 
GACGCCAGGA CGGTCAAGGT GTCCTTCTCC TCCCCCGCGC TCGGCTTCAT CGCCACGCTG 
GCGTACCACG GCTGCATCCT CCTGTCCCCC AAGACCCTCG CTCTGCCGGT GGACGCCCAG 
GCGGACCTGG CGCAGGAAAT CGGCAGCGGC CCGTTCATCC TCAAGTCCTG GAAGCAGGGC 
GACTCGTACG TGCTCGAGAA GCGCAAGGAC TACAACTGGG GGCCGGCCGC CCTGGGCCAC 
ACGGGCCCGG CCCGCCTGGA CACCATCACC TACAAGGTCA TCAAGGACAC CTCGGTGCGG 
ACCTCCACGG TGGCGTCCGG CCAGGCGGAA GTTGCCTTCA ACGTGGAGCC GCAGGAAATC 
GACTCCCTCA AAGCGCAGGG CTTCACCGTG GGAACACCCA AGTACCTGGG CTTCGTGGAC 
GGCTTCCAGG TCAACACCCA GGCCTTCCCC ACCAACGATC CCAGCGTCCG CCAGGCCATC 
CAGCACGGCA TCGACCGTGA GGAGATCCGG AACACCGTCT ACACGGAGGA CTGGGATGCG 
GCCACCACGT TCATCCAGGG CAACGTCCCG GAGGCCGGCG ACTACAGCAG TGCCTTCGCC 
TTCGATGCGG ACAAGGCGAA GAAGCTGCTG GACGACGCCG GCTGGAAGCC CGGTCCCGAC 
GGGTTCCGCG TGAAGGACGG CAAGGTCCTC GAGTTCCCGC TCACGCCCAA CCCCTACGTT 
CCCTCCACCA AGGCCGAGGA CGAGCTCATC GCCCAGCAGC TGGAGCGCAT CGGCATCAAG 
GTCAACCTCA AGGTGGTGGA CGTGGCCGGT TACGCCGCCA TCCAGGCCAG CCGTCCGCCG 
CTGTTCCAGA CTTCCCGCAG CTTCGTGGAC GTGGGAACGG TGGCCGGCGT GCTGACCAGC 
CAGAACAACG GCGAAAACTG GTTCAACCTG GGCACCAGTG ACCAGAAGCT CAACGATCTG 
TCCACCGCGA TCGCCAGCGC CTCTGACAGG GAATCCCGCA AAAAGGTGGC CGGTGACCTG 
CAGCAGTACG TCCTGGAACA GGGCTACTTC ATCCCCCTCA ACCAGCTGGT TCAGCGCCTG 
TACCTGATCT CGCCCGCGGT CAAGGGCGTC CAGTACAACG GCCTGGCGTA CGCCAACTTC 
TACACCGCCT GGGTGGCCAA GTGA

Protein sequence

MTPIEFRRRA FLAGITAITG SAVLTACGGP SATSSSDAGT PVDGGNITFL IQGYDTGWVS 
SKTSISSYEG NLWGQITDKL VYVDDKGQLS PWVAESWEEL NGAKDFVLHL KDGVTFSDGT 
PLDAAAVVAN LNAWAKGAPD RGVSKVGLFP SSNFASAEAA DARTVKVSFS SPALGFIATL 
AYHGCILLSP KTLALPVDAQ ADLAQEIGSG PFILKSWKQG DSYVLEKRKD YNWGPAALGH 
TGPARLDTIT YKVIKDTSVR TSTVASGQAE VAFNVEPQEI DSLKAQGFTV GTPKYLGFVD 
GFQVNTQAFP TNDPSVRQAI QHGIDREEIR NTVYTEDWDA ATTFIQGNVP EAGDYSSAFA 
FDADKAKKLL DDAGWKPGPD GFRVKDGKVL EFPLTPNPYV PSTKAEDELI AQQLERIGIK 
VNLKVVDVAG YAAIQASRPP LFQTSRSFVD VGTVAGVLTS QNNGENWFNL GTSDQKLNDL 
STAIASASDR ESRKKVAGDL QQYVLEQGYF IPLNQLVQRL YLISPAVKGV QYNGLAYANF 
YTAWVAK