Gene RPB_1052 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPB_1052
Symbol
ID	3908904
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris HaA2
Kingdom	Bacteria
Replicon accession	NC_007778
Strand	-
Start bp	1207809
End bp	1208939
Gene Length	1131 bp
Protein Length	376 aa
Translation table	11
GC content	67%
IMG OID	637882945
Product	FAD-dependent pyridine nucleotide-disulphide oxidoreductase
Protein accession	YP_484673
Protein GI	86748177
COG category	[C] Energy production and conversion
COG ID	[COG1252] NADH dehydrogenase, FAD-containing subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCAACA TCACCATCAT CGGCTCGGGC TTCGCGGCGC TCACCGCAGC GCGCGCGCTG 
CGCAAGCGCA AGGTCGATGC GTCGATCACC ATGATCTCGC CGCGTCGCGA GCTGCATTTC 
CTGCCGAGCA CGATCTGGAT CCCGGCCGGC ATCCGCAGCG GCGCGCGGCT GAAAGTGCCG 
CTGGGGCATT TCTTCGAGAA GTACCGGATC GACTTCGTCG AGGCCTCGGT GACCGGGCTG 
AAAGACGGCG GCCGAATCGT CGAGACCGAT CGCGGCGATT TTTCCAACGA TCATCTGATC 
GTCGCCTGCG GCGCCCGCTT CATCCGCAAG CTGCCGGGCA TCGAGCACGC GCTGATCCCA 
TGCGAGGGCA TCGCGGTCGG CGAGGAGATC GGCCGGCGGC TCGACGCGAT GAAGGGCGGC 
ACCATCGCGG TCGGGTTCTC CACCAATCCG GAGGAGCCCG GCGCGATGCG CGGCGGGCCG 
ATGTTCGAAT TCCTGTTCAT CATCGATACG CTGCTGCGCC AGCGCGGCAA ACGGCCGGGG 
TTCCAGATCG TGTTCTTCAG CCCGTCGCCG CGGCCGGGCG CGCGGCTCGG CGAGCGCGCC 
GTGGACGGAC TGCTGCGGGA GATGAAGGAT CGCGGCATCG CCACGCAGCT CGGCCGCAAG 
ATTCTGCGCA TCGAAGAGCG CAAGGTCGTG CTCGACGGCG GCGGCGAGAT CGAGGCCGAT 
CTGATCCTGT TCATGCCGGG GCTGACCGGC CCGGCTTGGC TGGCGAATAC CGAACTGCCG 
CTGTCGCCCG GCGGCATGAT CAAGGCCGAC GAGATGTGCC GGGTCGACGG CCTGCCCAAT 
GTCTGGGTCG CCGGCGATGC CGGGTCGTTT CCGGGGCCGG ACTGGATGCC GAAACAGGCG 
CATCAGGCCG ACCTGCAGGC GCTCGCGGTG GCGGCCAACA TCGCCGCGGT CGAGAGCGGC 
GACGCGCCGT CGACGCGGTT CAAGCCGGAG CTGGTGTGCA TCGTCGACAC GCTGGATTCC 
GGCATGCTGG TTTTCCGCAA CGAGAAGTTC AATTTCGTCG GGCCGAAGAT GAAGCTGTTC 
CACTGGCTGA AGCGGCTGTT CGAACGGCAC TATCTGACGA CGTTCCGCTG A

Protein sequence

MTNITIIGSG FAALTAARAL RKRKVDASIT MISPRRELHF LPSTIWIPAG IRSGARLKVP 
LGHFFEKYRI DFVEASVTGL KDGGRIVETD RGDFSNDHLI VACGARFIRK LPGIEHALIP 
CEGIAVGEEI GRRLDAMKGG TIAVGFSTNP EEPGAMRGGP MFEFLFIIDT LLRQRGKRPG 
FQIVFFSPSP RPGARLGERA VDGLLREMKD RGIATQLGRK ILRIEERKVV LDGGGEIEAD 
LILFMPGLTG PAWLANTELP LSPGGMIKAD EMCRVDGLPN VWVAGDAGSF PGPDWMPKQA 
HQADLQALAV AANIAAVESG DAPSTRFKPE LVCIVDTLDS GMLVFRNEKF NFVGPKMKLF 
HWLKRLFERH YLTTFR