Gene Daro_4043 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Daro_4043
Symbol
ID	3567040
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Dechloromonas aromatica RCB
Kingdom	Bacteria
Replicon accession	NC_007298
Strand	+
Start bp	4342662
End bp	4343828
Gene Length	1167 bp
Protein Length	388 aa
Translation table	11
GC content	60%
IMG OID	637682515
Product	extracellular ligand-binding receptor
Protein accession	YP_287239
Protein GI	71909652
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0683] ABC-type branched-chain amino acid transport systems, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	71
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCGCTTC GCCTGACTGC CCTTGCAGCC GCCCTGATGC TTGCCGGTTC CGCCCATGCC 
GCCGACCAGA TCAAGGTTGG GCTGGTTTCG ACACTGTCTG GCCCTGGCGC CGGCCTCGGC 
GTCGATATTC GCGACGGCTT CAATCTGGCC ATGAAGCATC TGAACGGCAA GCTGGGCAAT 
CTGCCGGCCG AGGTGCTGAT CGCCGACGAT CAGCAGAATC CGGATATCGC CAAACAAACG 
GCCGACAAGT TCCTGAAGAA GGACAAAGTC GATTTCATGA CTGGCATTGT CTTCTCCAAC 
ATCATGCTCG CCGTCGGCCC GACCGTCTTC GAGAACAAGA CCTTCTACAT TTCGGCCAAC 
GCCGGCCCGT CGCAGTATGC CGGCGAGCAG TGCAATCCCT TCTTCTTCAA CGTCGCCTGG 
CAGAACGACA ACCTGCACGA AGCCGTCGGC AAGGTGGTGC AGGACAAGGG CTACAAGAAC 
GTCGTGATCG TCACCCCGAA CTACCCGGGC GGCAAGGATG CAGTGTCTGG TTTCAAGCGC 
TACTACAAGG GCAAGGTGGC CGACGAGATC TACACCAAGC TCGGCCAGCT CGACTATGCC 
GCCGAACTGG CGCAGATTCG CGCCACCAAG CCGGATGCAC TGTTCTTCTT CCTGCCGGGC 
GGCATGGGCA TCAACTTCGT CAAACAGTTC GTTTCAGCCG GCCTGTCGCG CGACACGCAG 
CTGTTTGCCC CCGGCTTCTC GGCCGATGAG GACGTGATCA AGGCCGTCGG CAGCTCGATG 
ATGGGCATGT TCAACTCGTC GCACTGGGCG CACGACATGG ACAATGCCGA GAACAAGCGC 
TTCGTTGCCG ACTTCCAGAA GGAATATGGC CGCCTGCCCT CGCTCTACGC TTCGCAGGGC 
TACGATGCGG CGCTGATGAT GGATGCCGCC GTGCGTGATG TGAAGGGCAA GGTCGAGGAC 
AAGGCCGCGT TGCAGAAGGC ACTGGAAGCC AAGCGCTTCA AGTCCGTGCG CGGCGACTTC 
AAGTTCAACA CCAACCACTA CCCGGTGCAG AACTACTACC TGCGCGCCAT CGGTAAGGAT 
GCCCAAGGCC GGGTAACGAA CAAGACCATG GGCACCATCT TCACCAACCA TGCGGATGCC 
TACGTTGCTT CCTGCAAGAT GAAGTGA

Protein sequence

MSLRLTALAA ALMLAGSAHA ADQIKVGLVS TLSGPGAGLG VDIRDGFNLA MKHLNGKLGN 
LPAEVLIADD QQNPDIAKQT ADKFLKKDKV DFMTGIVFSN IMLAVGPTVF ENKTFYISAN 
AGPSQYAGEQ CNPFFFNVAW QNDNLHEAVG KVVQDKGYKN VVIVTPNYPG GKDAVSGFKR 
YYKGKVADEI YTKLGQLDYA AELAQIRATK PDALFFFLPG GMGINFVKQF VSAGLSRDTQ 
LFAPGFSADE DVIKAVGSSM MGMFNSSHWA HDMDNAENKR FVADFQKEYG RLPSLYASQG 
YDAALMMDAA VRDVKGKVED KAALQKALEA KRFKSVRGDF KFNTNHYPVQ NYYLRAIGKD 
AQGRVTNKTM GTIFTNHADA YVASCKMK