Gene Rpal_5089 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rpal_5089
Symbol
ID	6412783
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris TIE-1
Kingdom	Bacteria
Replicon accession	NC_011004
Strand	-
Start bp	5475593
End bp	5476825
Gene Length	1233 bp
Protein Length	410 aa
Translation table	11
GC content	66%
IMG OID	642714974
Product	cysteine desulfurase NifS
Protein accession	YP_001994053
Protein GI	192293448
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1104] Cysteine sulfinate desulfinase/cysteine desulfurase and related enzymes
TIGRFAM ID	[TIGR03402] cysteine desulfurase NifS

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCGAGC CGGCAGACAT CGTCTATCTC GACGCCAATG CAACGACGCG GACCGATCCG 
CGCGTCGTCG AAGCGATGCT GCCGTACTTC TCGCTGTACT ACGGCAACCC GTCGTCGAAA 
TATGGGCTCG GCGGCCATGC TGCGCTCGCC GTCAAGCGAG CGCGCGAGCG CGTTCAGGCG 
CTGCTCGGCG CCGCACAGCC GCACGAACTG ATCTTCACCT CGGGTGGTAC CGAGAGCAAC 
AACGCCGCAA TCCTGTCCGC GCTCGAAGCG GCGCCGCGTC GGCGCGAAGT GATCATCTCG 
GCGGTGGAAC ATCCGGCGGT GCTGTCGCTG TGCGCCTGGC TGGAAAAGAA CAAGGGCATC 
CGCGTTCACC TGATCCCGGT CGATCGTCAG GGACGGCTCG ACATTCTGGC CTATCGCGAA 
GCGATGTCCG ACCGTGTCGC GATCGCGTCG ATCATGTGGG CCAATAATGA GACCGGTGTG 
ATCCAGCCGG TGGCTGATCT CGCCGAGCTC GCCAAGGAGG TCGGCGCGCT GTTTCACACC 
GACGCGGTGC AGGCGGTCGG CAAGTGTCCG ATCGATCTGC AGTCGACCAT GATCGACATG 
CTGTCGCTGT CCGGACACAA GCTGCACGGC CCGAAGGGCG TCGGCGCGCT GTATGTCCGC 
GCCGGCATCC GCTTCAAGCC GCAGATCAAA GGTGGCCAGC AGGAGCGTGG CCGCCGCGCC 
GGTACCGAGA ACGTGCCGGG CATCGTCGGT CTCGGCATTG CGGCCGAACT TGCCGCTGGT 
GCGATGGCCG ACGAGGACAT TCGGGTGCGT GGCCTGCGCG ACCGGCTCGA ACGCGAGATC 
CTGGCGCGGG TCGACCATTG CGTTGCCGTC GGTGCCCGCG CCGAGCGTCT GCCTAATACA 
TCGAACATCG CGTTCTCGTT CATCGACAGC GAGGCGATCA TCACGCTGCT GGATCGCGCC 
GGCATTGCCG CCTCGATGGG ATCGGCGTGC GCGACCGGCT CGTTCGAGCC GTCGCATGTG 
CTGCTGGCTA TGAAAGTCGC AGAGGACGCG GTCCGCGGCG GCGTGCGGTT CTCGCTGTCA 
CGCGACAACA CCGACGCCGA CATCGACCGC GCGCTGGAAG TCGTTCCCGC CGTGGTGGCC 
AAGCTGCGGG CGATCTCGCC GTTCGGGGTC GATGATGCTC CGCAGGCGGT CGGGCGTTCG 
TCTGGAAGTG CGCAAGGAAC AACCCATGTC TGA

Protein sequence

MSEPADIVYL DANATTRTDP RVVEAMLPYF SLYYGNPSSK YGLGGHAALA VKRARERVQA 
LLGAAQPHEL IFTSGGTESN NAAILSALEA APRRREVIIS AVEHPAVLSL CAWLEKNKGI 
RVHLIPVDRQ GRLDILAYRE AMSDRVAIAS IMWANNETGV IQPVADLAEL AKEVGALFHT 
DAVQAVGKCP IDLQSTMIDM LSLSGHKLHG PKGVGALYVR AGIRFKPQIK GGQQERGRRA 
GTENVPGIVG LGIAAELAAG AMADEDIRVR GLRDRLEREI LARVDHCVAV GARAERLPNT 
SNIAFSFIDS EAIITLLDRA GIAASMGSAC ATGSFEPSHV LLAMKVAEDA VRGGVRFSLS 
RDNTDADIDR ALEVVPAVVA KLRAISPFGV DDAPQAVGRS SGSAQGTTHV