Gene Rpal_1842 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rpal_1842
Symbol
ID	6409501
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris TIE-1
Kingdom	Bacteria
Replicon accession	NC_011004
Strand	-
Start bp	1978361
End bp	1979578
Gene Length	1218 bp
Protein Length	405 aa
Translation table	11
GC content	60%
IMG OID	642711730
Product	hypothetical protein
Protein accession	YP_001990843
Protein GI	192290238
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0683] ABC-type branched-chain amino acid transport systems, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	0.839069
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGACTCT TCGGACTTGC GGCCGTTGTC GCGGCGACAT CGTTGTTCGC ACCCGGCGTT 
GCGCTTGCGC AGAAATCCTA CGGCCCGGGA GCCAGTGACA CCGAGATCAA AGTCGGCAAT 
TTCGTGCCTT ATAGCGGCCC GGCGTCGGCT TACGGCATCG TCGGCCAGGT CCAGAGCGCC 
TACGTCAAGA TGCTGAACGA GAAAGGCGGC ATCAACGGCC GCAAGATCAA TTTCATTTCG 
TATGACGATG CCTACTCGCC GCCGAAGGCG GTGGAGCAGA CCCGCAAGCT GGTCGAAGGC 
GACGAGGTGC TGTTCCTGTA CCACACGCTC GGTACGCCAT CGAACACCGC CGTCATGAAA 
TATCTGAACC AGAAGAAGGT GCCGCAGCTG ATGCTGTCGA GCGGCGGCAC GCGGTTCGGC 
GATGATCCGA AGACCTATCC GTGGACCATG CCGTTCAATC CGCCCTATCA GGCGGAGGGT 
CGGATCTACG CGAAGTGGAT CATGGCAACC TATCCCAACG CAAAGATCGC CGTGCTGGTG 
GCGAACGACG ACTACGGCAA GGACATCTAC AAGGGCGTCA AGGACGGCTT CGGCGCCAAG 
ACCTCGATGA TCATTTCGGA GGCGACCTAC GACATCACCG ATCCGACCAT CGATTCGCAG 
ATGGCCAAGC TCAAGGCTTC GGGCGCCGAT CTGTTCCTCA ATCTCTCCAC GCCGAAATTC 
GCCGCGCTGG CGATCCGCAA GATGGGCGAA CTCGGCTGGA AGCCGGTTCA TGTTCTCAAC 
AACGTCTCGT CGTCGGTCGG TGCAGTGATC AAACCAGCCG GGATGGAATA TGCCCAGGAC 
GCGATCACCG CGAACTACGT CAAGGACCCG ACCGATCCGA CCTGGAAGAA CGATCCGGGC 
GTGAAGGAGT GGGACGCCTT CCTCGAGAAA TACATGCCGG GCGCCGATCG CTCCAACGGT 
CTGCTGCTGT ATTCCTATGG CGCGGGGCAG ACGCTGGAAT ACATCCTGAG GCAGGCTGGC 
GATAATCTGA CCCGCGAGAA CATCATGAAG GTGGCGACCA GCCTGAAGGG CTACGCACCG 
GCCTCGCTGC TGCCAGGCAT CACCATGAAC ACATCACCCA CCGATCATTT TCCGATCGAG 
CAGATGCAGC TGATGCGGTT CAAGGGCGAC CGCTGGGAGA TGTTCGGCGA CGTGCTCGAG 
GCACGGGTCA CCAACTAA

Protein sequence

MRLFGLAAVV AATSLFAPGV ALAQKSYGPG ASDTEIKVGN FVPYSGPASA YGIVGQVQSA 
YVKMLNEKGG INGRKINFIS YDDAYSPPKA VEQTRKLVEG DEVLFLYHTL GTPSNTAVMK 
YLNQKKVPQL MLSSGGTRFG DDPKTYPWTM PFNPPYQAEG RIYAKWIMAT YPNAKIAVLV 
ANDDYGKDIY KGVKDGFGAK TSMIISEATY DITDPTIDSQ MAKLKASGAD LFLNLSTPKF 
AALAIRKMGE LGWKPVHVLN NVSSSVGAVI KPAGMEYAQD AITANYVKDP TDPTWKNDPG 
VKEWDAFLEK YMPGADRSNG LLLYSYGAGQ TLEYILRQAG DNLTRENIMK VATSLKGYAP 
ASLLPGITMN TSPTDHFPIE QMQLMRFKGD RWEMFGDVLE ARVTN