Gene Daro_4023 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Daro_4023
Symbol
ID	3567195
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Dechloromonas aromatica RCB
Kingdom	Bacteria
Replicon accession	NC_007298
Strand	-
Start bp	4321875
End bp	4322900
Gene Length	1026 bp
Protein Length	341 aa
Translation table	11
GC content	63%
IMG OID	637682496
Product	TRAP dicarboxylate transporter- DctP subunit
Protein accession	YP_287220
Protein GI	71909633
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1638] TRAP-type C4-dicarboxylate transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	32
Plasmid unclonability p-value	0.000715692
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACGAAA TCCGGCGCAA TATCCTGAAA GGCATGGTTG CCACACCGGC TTTGGCCCTG 
TCGCCCAATC TGCTGTGGGC GCAAGCGGCT GGCGAGTTGA AAATTTCGCA CCAGTTCCCT 
GGTGGCACCG CGACCGAAGG CGATTTCCGC GACCGACTCT GTCGCCGCTT CAGCGCCGAA 
ATTACCAAGC GAACCAATGG CGCCTTGAGG GGCACGGTTT ATCCCGGATC GTCGTTGATG 
AAGACCAACG CCCAGTTCAG TTCGGTACGC AAAGGCGCGC TCGACATGAC GCTGGTGCCG 
CTCTCCTATG CCGGCGGCGA AGTGCCGGAA ACCAACATCG GGCTGATGCC GGGCATCGTC 
ACTTCCTACG AGCAGGCAGT GAGCTGGAAG AAAGCCGAGA TCGGCAAGGC GCTGGCCAAT 
ATCCTCGCCG ACAAGGGCGT GCTGGTTGTC AGCTGGATCT GGCAGGCCGG CGGCGTCGCC 
AGTCGGGTCA AGCCGATCAT CGATCCGGAA GATGCCAAGG GCCTGAAAGT CCGCGGCGGC 
AGCCGCGAGA TGGACATGGT GCTGAAGCAG GCCGGCGCCA CGGTGCTGAC CCTGCCGTCG 
AACGAAATCT ACGCCGCGAT GCAGACCGGC GCGCTGGATG CCGCGATGAC CTCGTCGACC 
AGCCTGATTT CCTTCCGTCT CGAAGAAGTC GGCAAGGCGC TGACCACCGG CCGCGGCAAG 
ACTTACTGGT TCATGTTCGA ACCCTTGCTG ATCTCCCGTG CGGTCTTCGA GAAACTGCCC 
AAGGCGCAGC AGGATGCGAT CATGGCGGTT GGTGCCGAGA TGGAGGCTTA CGCGCTGGAA 
GGGGCCAGGG CCGATGACCA GGCCGTGGCG GCGGTTTACC AGAAAGCCGG CGGCAAGGCT 
TACGACCTGT CCGACGCCTC GGTCAAGAAA TGGCAGGCGA TTGCCCGCGA TACCGCCTGG 
AAGGACTTCG CGGCCAAGAA TGAGAGCTGC GCCCGTATCC TCAAACTGGC CGAGGCCACG 
CTGTGA

Protein sequence

MNEIRRNILK GMVATPALAL SPNLLWAQAA GELKISHQFP GGTATEGDFR DRLCRRFSAE 
ITKRTNGALR GTVYPGSSLM KTNAQFSSVR KGALDMTLVP LSYAGGEVPE TNIGLMPGIV 
TSYEQAVSWK KAEIGKALAN ILADKGVLVV SWIWQAGGVA SRVKPIIDPE DAKGLKVRGG 
SREMDMVLKQ AGATVLTLPS NEIYAAMQTG ALDAAMTSST SLISFRLEEV GKALTTGRGK 
TYWFMFEPLL ISRAVFEKLP KAQQDAIMAV GAEMEAYALE GARADDQAVA AVYQKAGGKA 
YDLSDASVKK WQAIARDTAW KDFAAKNESC ARILKLAEAT L