Gene Rru_A1201 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rru_A1201
Symbol
ID	3833699
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodospirillum rubrum ATCC 11170
Kingdom	Bacteria
Replicon accession	NC_007643
Strand	+
Start bp	1418730
End bp	1419791
Gene Length	1062 bp
Protein Length	353 aa
Translation table	11
GC content	65%
IMG OID	637825290
Product	MaoC-like dehydratase
Protein accession	YP_426289
Protein GI	83592537
COG category	[I] Lipid transport and metabolism
COG ID	[COG2030] Acyl dehydratase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGGCAAGA CCAATCCGGG TAATTTCTTC GAGGACTTCG CTCCCGGCCA GCAGCTTGTC 
CATGCCACGC CGCGCACGCT GACCGAGGGC GACGCCGCCC TTTACACAGC CCTTTACGGG 
TCACGCTTCG CCGTGCAGTC CTCGGCCTCC TTCGCCATGG CGATCGGCTA TCCGGAAGCG 
CCTTTGGACG ATCTGCTGGT CTTCCATGTG GTCTTTGGCA AGACCGTGCC CGACATCAGC 
CTGAACGCCG TGGCCAATCT GGGCTATGCC CGGGGGCGGA TGGGGGTGCC GGTCTACCCG 
GGCGATACCC TGCGCGCCCT CAGCCGGGTG ATCGGCGTCA AGGAGAACTC CAACGGCAAG 
ACCGGGGTGG TCTATGTCAA TTCCGTCGGT CTGAATCAGA ACGACGAGGT GGTGGTCGAT 
TTCATTCGCT GGGTTATGGT GCAAAAGCGC GATCCGGCCC ACCCGGCCCC CGAACCCGAG 
ATCCCCGATC TGCCCGACCG CGTCGCGCCC GAGGATCTTT ACCTGCCCGA GGGCCTTGAT 
CCGCGCGGCT ATGACCCGGA ACTGGCCGGT TCGGCCCATT TCTGGGAGGA TTACGCGGTC 
GGCGAGCGCA TCGACCACGG CGATGGCATG ACCATCGAGG AAGCCGAGCA TATGATGGCG 
ACGCGGCTGT GGCAGAATAC CGCCAAGGTC CATTTCAACC AATATGAGCA GGCCAAGGGG 
CGGTTCGGCC GTCGGCTGGT CTATGGCGGC CATGTCATCA GCCTGGCCCG GGCGCTCAGT 
TTCAACGGCC TGGGCAACGC CTTCCGCGTC GCGGCGATCA ATGCCGGCAG CCACTGCAAT 
CCGACCTTCG CCGGCGATAC CATCCACGCT TGGTCGGAGG TGCTCGAGCG CGCCGATCTG 
CCCGCCGACG AGGGGTTTGG CGCCCTGCGC CTGCGCACCA TCGCCACCAA GGACCGCGCC 
TGCGCCGATT TTCCCTATCG CGACGAGCAG GGCCACATCC GCCCCGAGGT CGTGCTTGAT 
CTCGACTATT GGGTGGTGAT GCCCAAGGCG GAAGGGAAAT GA

Protein sequence

MGKTNPGNFF EDFAPGQQLV HATPRTLTEG DAALYTALYG SRFAVQSSAS FAMAIGYPEA 
PLDDLLVFHV VFGKTVPDIS LNAVANLGYA RGRMGVPVYP GDTLRALSRV IGVKENSNGK 
TGVVYVNSVG LNQNDEVVVD FIRWVMVQKR DPAHPAPEPE IPDLPDRVAP EDLYLPEGLD 
PRGYDPELAG SAHFWEDYAV GERIDHGDGM TIEEAEHMMA TRLWQNTAKV HFNQYEQAKG 
RFGRRLVYGG HVISLARALS FNGLGNAFRV AAINAGSHCN PTFAGDTIHA WSEVLERADL 
PADEGFGALR LRTIATKDRA CADFPYRDEQ GHIRPEVVLD LDYWVVMPKA EGK