Gene Daro_4097 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Daro_4097
Symbol
ID	3566713
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Dechloromonas aromatica RCB
Kingdom	Bacteria
Replicon accession	NC_007298
Strand	+
Start bp	4392752
End bp	4393891
Gene Length	1140 bp
Protein Length	379 aa
Translation table	11
GC content	61%
IMG OID	637682569
Product	extracellular ligand-binding receptor
Protein accession	YP_287293
Protein GI	71909706
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0683] ABC-type branched-chain amino acid transport systems, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	58
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATCAAGA AGCTGACCCT CGCCGTACTC GCCACCATCT CCACCGCGGC GCTGGCCGAC 
ATCAATGTTG GCGTTTCCGT CGCCGCCACC GGTCCGGCCG CCTCGCTCGG CATTCCGGAA 
AAGAACACCT TCGCCCTGTT GCCGACCACC ATCGGCGGCC AGAAGGTCAA TTACATCATC 
CTCGATGACG CGACCGATCC GACCGCGGCG ACCAAGAACA TCAAGAAGCT GATCAGCGAA 
AACAAGGTCG ACGTCGTCGT CGGCTCGTCG ACCACGCCGA GTTCGCTGGC CATGATGGAT 
GTCGCCGTCG AGAACGAAAC CCCGCTGATT TCCATGGCCG GTTCCGCCAT CGTCGTCGAA 
CCGATGGACG ACAAGCGCAA ATGGGTATTC AAGACGGCCC AGAACGATGC CCACATGGCC 
ACCGCGCTGG TCCAGCACAT GACCGACAAG AACGTGCAGA CCGTCGCCTT CATCGGCTTT 
GCCGACGCCT ACGGCGAAGG CTGGTACAAG GAATTCGCCA AGATCGCCGA GGTCCGCAAG 
CTGAAGATCG TCGCCAGCGA GCGTTACCAG CGCAACGATA CCTCGGTGAC CGGCCAGATT 
CTCAAGATCA TGTCCGCCAA GCCGGATGCT GTTCTGGTCG GCGGTGCCGG TACCCCGGCC 
GCCCTGCCAC AGAAGGTGCT TAAGGAAAAA GGCTACAAGG GCCTGATCTA CCAGACGCAC 
GGCGTGGCCA ACAATGATTT CCTGCGCGTC GGCGGCAAGG ATGTCGAAGG CGCTTTCCTG 
CCGGTCGGCC CGATGGTCGT TGCAGCGCAG CTGTCGAATG ACAACCCGGT CAAGAAATCG 
GCACTGGAGT ATGTGAGCAA GTACGAAGCT GCCCACGGCA AGGGCAGCGT CAGCTCCTTC 
GGCGGCCACG CCTGGGATGC CGGCGTACTG CTCGGCAGCG CCATTCCGGT TGCCCTGAAG 
AAAGCCAAGC CGGGTACGGT CGAATTCCGT CGTGCCCTGC GCGACGCGTT GGAGAACACC 
AAGAACGTCG CCGGCGCCCA CGGCATCTTC AACCTGACGC CGAACGACCA CCAGGGTTTC 
GACCAGCGCG CCCGCGTCAT GGTGACCATC GAAAACAACA CCTGGAAACT GCTGAAATAA

Protein sequence

MIKKLTLAVL ATISTAALAD INVGVSVAAT GPAASLGIPE KNTFALLPTT IGGQKVNYII 
LDDATDPTAA TKNIKKLISE NKVDVVVGSS TTPSSLAMMD VAVENETPLI SMAGSAIVVE 
PMDDKRKWVF KTAQNDAHMA TALVQHMTDK NVQTVAFIGF ADAYGEGWYK EFAKIAEVRK 
LKIVASERYQ RNDTSVTGQI LKIMSAKPDA VLVGGAGTPA ALPQKVLKEK GYKGLIYQTH 
GVANNDFLRV GGKDVEGAFL PVGPMVVAAQ LSNDNPVKKS ALEYVSKYEA AHGKGSVSSF 
GGHAWDAGVL LGSAIPVALK KAKPGTVEFR RALRDALENT KNVAGAHGIF NLTPNDHQGF 
DQRARVMVTI ENNTWKLLK