Gene Rpal_0449 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rpal_0449
Symbol
ID	6408097
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris TIE-1
Kingdom	Bacteria
Replicon accession	NC_011004
Strand	-
Start bp	484575
End bp	485720
Gene Length	1146 bp
Protein Length	381 aa
Translation table	11
GC content	67%
IMG OID	642710361
Product	CBS domain containing protein
Protein accession	YP_001989485
Protein GI	192288880
COG category	[R] General function prediction only
COG ID	[COG1253] Hemolysins and related proteins containing CBS domains
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCCGACG GCGACAGAGC CGAGAACGGT TCGCAGGCCT CGCTGCAGGA CTCCACGCGC 
GGCCAGTTAC CCGCGGTGGT GCATCAGGGC GAAGTGCTGC ATCCGCATGG CGGCAGTTGG 
CTGATCCGTG CGATCCGTTC GCTGTTCGGC TGGAAGCCCG GCTCGGTGCG CGACGACCTG 
CAGGTCGTGC TCGACACCAG CCCGCCCGAC GACACCGGCT TCTCGACGCT CGAGCGCACG 
ATGCTGCGCA ACATCCTCGG GCTGCACGAT CGCCGGATCG CCGACGTGAT GGTGCATCGC 
GCCGACATCG TCGCGATCAA GCAGGACATC CAGCTCGGCG AATTGCTCAG CCTGTTTCAG 
GACGCAGCGC ATTCGCGGCT CGTGGTTTAC AACGAAACGC TCGACGATCC GGTCGGCATC 
GTTCACATCC GCGACCTCGT GGCGTTCATG ACCGCAAAGG CGAAGGTGCC GCCGGCGACG 
GTCGCCAAGC GCAAGAAGGC GCTGCCCGCG GGCCTCGATC TGCGCGCGAT CGATCTGAAG 
ATGCCGCTGA CCGAAACCGG CATCATCCGC AAGCTGCTGT ATGTGCCGCC GTCGATGCGG 
GCGATCGACC TGCTGGCGCA GATGCAGGCG GCGCGCATCC ATCTGGCGCT GGTGGTCGAC 
GAATACGGCG GTACTGATGG CCTGGTCTCG ATCGAAGATA TCGTCGAACA GATCGTCGGC 
GAGATCGATG ATGAACACGA CTCGACCGAG CCGCCGTCGA TCGTGCGCCA GGCCGACGGC 
TCGTTCATCG CCGATGCGCG AGCCAGTCTG GAAGACGTCC GCGCCATGAT CGGCGATCAG 
TTCGTCACCG GCGAAGCGGG CGAAGACGTC GAAACCCTCG GCGGTTACCT CGTCAACCAC 
GTCGGCCGGC TGCCGGTTCG CGGCGAAGTG ATCGCCGGCC CCGGCACCTT CGAATTCGAA 
GTGCTCGACG CCGACCCACG GCGGGTGAAG CGGTTGCGGA TCGGACCGCG CAAGGAACGC 
CCCGCCCCGC GCACACGCGA CAGCCGGCGG CGCGAGACCG CGACCGATTC CGCCGCGCCG 
CAGACTACTG ACAGCGGCGG ATCCACCTCC TCTCCACCTG CCGGCGACGG GACCGGTTCG 
CCGTGA

Protein sequence

MPDGDRAENG SQASLQDSTR GQLPAVVHQG EVLHPHGGSW LIRAIRSLFG WKPGSVRDDL 
QVVLDTSPPD DTGFSTLERT MLRNILGLHD RRIADVMVHR ADIVAIKQDI QLGELLSLFQ 
DAAHSRLVVY NETLDDPVGI VHIRDLVAFM TAKAKVPPAT VAKRKKALPA GLDLRAIDLK 
MPLTETGIIR KLLYVPPSMR AIDLLAQMQA ARIHLALVVD EYGGTDGLVS IEDIVEQIVG 
EIDDEHDSTE PPSIVRQADG SFIADARASL EDVRAMIGDQ FVTGEAGEDV ETLGGYLVNH 
VGRLPVRGEV IAGPGTFEFE VLDADPRRVK RLRIGPRKER PAPRTRDSRR RETATDSAAP 
QTTDSGGSTS SPPAGDGTGS P