Gene Rsph17029_3938 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rsph17029_3938
Symbol
ID	4898240
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides ATCC 17029
Kingdom	Bacteria
Replicon accession	NC_009050
Strand	+
Start bp	1071145
End bp	1072167
Gene Length	1023 bp
Protein Length	340 aa
Translation table	11
GC content	78%
IMG OID	640114541
Product	FAD-dependent pyridine nucleotide-disulphide oxidoreductase
Protein accession	YP_001045788
Protein GI	126464675
COG category	[C] Energy production and conversion
COG ID	[COG1252] NADH dehydrogenase, FAD-containing subunit
TIGRFAM ID	[TIGR01409] Tat (twin-arginine translocation) pathway signal sequence

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.0505598
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATGCAGA GCCTGAGCCG CCGCCATTTC ACCCTTGGCC TAGCCGCCGC AGCCAGTCTC 
GCGACGGCAG GCGCCGCCTT CGCGCTTCGT CCGGGCGAGC GCGTCCTCGT CGTGGGCGGC 
GGTCCCGCCG GGGCCGAGGC GGCGCTTGCG CTCAGGGCCG CTCATCCCCG GGCTTCGGTG 
CTGCTCGTCG AGCGCGATCC GACGCGGCTT GCGCGCGAGC CCGATGAGGC GGGCCTTGCG 
GGCTTCCTGC GCCCGCGCGC CGAGGCGGGG CTTGCGGCCC TGAAGGCCGC GGGCGTGGGT 
CTCGCCCTCG ACGAGGTGGT GAGCGTCGAC TGGGCCGCGG GGCGGGCCGT CCTCTTCTCG 
GGCCGCGATC TGGCCTTCGA CCGGCTGCTG CTCGCGCCCG GCACGGCGCC GCGCGACGAG 
GCGATCCCGG GGCTCGATGC GGTGGCCCGT CACGCCTGGC CCGCCGCCTG GGGCAGCCCG 
CGCGAGGCCC GACGTCTGCT CGCAGGTCTT CAGGCGCTGC CCGAGCGCGG CCATGTCGTC 
CTGCGCCTGC CCGAGGGCGA GGCCGCCCAT CCCGCGGCGG CGCTCGGCCG GGCGCTGGCG 
CTGGCGGGCC ATGTGGCGCG GCGGCCGGGC GCGCGGCTGA CGGTGCTCGA CGGCTCGAAG 
GGCGCGGATC TCGCCCGCGC CTTCGCCGAC CGTGCCCCTG CCGAGGCGGC TGCCCGGGTG 
GAGTGGGTCT CGGCCGCACA GGGCGGGCGG GTGCGCGCGG TGGATGCGCG GGCAGGGCTG 
ATCGAGACCG AGGCGGGACC GATCCGCGCG GATGTGGTGA ATTTCGTGCC GGCGCTGCGG 
GCGGGAACCA TCGCCGCGGC GGCGGGCCTG GCCGATGCGA GCGGCTGGTG CCCCTGCGAC 
GCGGCGGGCC GGTCGGTCCT GCGGCCCGAG GCTCTGGTGC TGGGCGACGC GCGGAAGTCG 
GCCCCGCGCA CCGTGGCCGA GGCGCTCCGG TCGGCGCGCG TCGCCACGGA TCACCTCGCC 
TGA

Protein sequence

MMQSLSRRHF TLGLAAAASL ATAGAAFALR PGERVLVVGG GPAGAEAALA LRAAHPRASV 
LLVERDPTRL AREPDEAGLA GFLRPRAEAG LAALKAAGVG LALDEVVSVD WAAGRAVLFS 
GRDLAFDRLL LAPGTAPRDE AIPGLDAVAR HAWPAAWGSP REARRLLAGL QALPERGHVV 
LRLPEGEAAH PAAALGRALA LAGHVARRPG ARLTVLDGSK GADLARAFAD RAPAEAAARV 
EWVSAAQGGR VRAVDARAGL IETEAGPIRA DVVNFVPALR AGTIAAAAGL ADASGWCPCD 
AAGRSVLRPE ALVLGDARKS APRTVAEALR SARVATDHLA