Gene Daro_2138 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Daro_2138
Symbol
ID	3569780
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Dechloromonas aromatica RCB
Kingdom	Bacteria
Replicon accession	NC_007298
Strand	-
Start bp	2305885
End bp	2306859
Gene Length	975 bp
Protein Length	324 aa
Translation table	11
GC content	63%
IMG OID	637680609
Product	cysteine synthase
Protein accession	YP_285349
Protein GI	71907762
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0031] Cysteine synthase
TIGRFAM ID	[TIGR01136] cysteine synthases [TIGR01139] cysteine synthase A

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.00000000166923
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	3
Fosmid unclonability p-value	0.0000932984
Fosmid Hitchhiker	No
Fosmid clonability	decreased coverage

Sequence

Gene sequence

ATGTCCAAAT GGTTTGCAGA TAATTCACAG TCGATCGGCC GCACGCCGCT GATCAAGCTC 
AACCGTGTCA TCGACGGCGC CAAGGCTACC GTGCTCGCCA AGATCGAAGG TCGCAACCCG 
GCCTATTCGG TCAAGTGCCG GATCGGCGCC GCCCTGATCA ATGATGCCGA GAAGCGTGGC 
CTGCTCGGTC CGGGCAAGGA GCTGGTCGAG CCGACTTCCG GCAACACCGG CATCGCGCTG 
GCTTTCGTCG CCGCCGCCAA GGGTATTCCG CTGACGCTGA CCATGCCCGA AACGATGAGT 
ATCGAACGGC GCAAGCTGCT GACGGCTTTT GGTGCCAAGC TGGTGCTGAC CGAAGGCGCC 
AAGGGCATGT CCGGCGCCAT CGCCAAGGCC GAGGAAATTG CCGCTTCCGA TGCCAAGTAC 
GTGTTGTTGC AGCAGTTCAA GAACCCGGCC AATCCGGCCA TCCACGAACT GACCACCGGT 
CCGGAAATCT GGGACGACAC CGATGGCGCC ATCGACATTC TGGTGTCCGG GGTCGGCACT 
GGCGGCACGA TCACCGGTGT TTCGCGTTAC ATCAAGAACA CCAAGGGCAA GGCGATCCAG 
TCGGTCGCCG TCGAGCCGAC CGCCAGCCCG GTGCTGACCC AGGCTCGTGC CGGCGAGCCA 
ATCAAGCCCG GTCCGCACAA GATTCAGGGG ATTGGCGCCG GTTTCGTGCC GGCCGTGCTC 
GATCTGTCGC TGCTCGATGC CGTTGAGCAA GTGTCTAATG AGGATGCCGT GCTTTACGCC 
CGCCGCCTGG CCAAGGAAGA GGGCATCATC TCCGGGATTT CCAGCGGTGC TGCGGTTGCG 
GCGGCCGCTC GTCTGGCCCG GATACCGGAA AATGCCGGCA AGACCATTGT CGCCATCCTG 
CCTGACTCCG GCGAGCGTTA CCTCAGCTCC ATCCTGTTCG AAGGCTTGTT CAACGAAGCC 
GGGCTGGCCG CATGA

Protein sequence

MSKWFADNSQ SIGRTPLIKL NRVIDGAKAT VLAKIEGRNP AYSVKCRIGA ALINDAEKRG 
LLGPGKELVE PTSGNTGIAL AFVAAAKGIP LTLTMPETMS IERRKLLTAF GAKLVLTEGA 
KGMSGAIAKA EEIAASDAKY VLLQQFKNPA NPAIHELTTG PEIWDDTDGA IDILVSGVGT 
GGTITGVSRY IKNTKGKAIQ SVAVEPTASP VLTQARAGEP IKPGPHKIQG IGAGFVPAVL 
DLSLLDAVEQ VSNEDAVLYA RRLAKEEGII SGISSGAAVA AAARLARIPE NAGKTIVAIL 
PDSGERYLSS ILFEGLFNEA GLAA