Gene Rcas_2420 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_2420
Symbol
ID	5539901
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	-
Start bp	3113063
End bp	3114172
Gene Length	1110 bp
Protein Length	369 aa
Translation table	11
GC content	57%
IMG OID	640894550
Product	oligopeptide/dipeptide ABC transporter, ATPase subunit
Protein accession	YP_001432518
Protein GI	156742389
COG category	[E] Amino acid transport and metabolism
COG ID	[COG4608] ABC-type oligopeptide transport system, ATPase component
TIGRFAM ID	[TIGR01727] oligopeptide/dipeptide ABC transporter, ATP-binding protein, C-terminal domain

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	29
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGATACCG CAAAGAAAAA TGGCACATCC GACGAGATTT TGCTCGAAGT TCGTGGGCTA 
AAGAAGCATT TTCCGATTCA GAGCGGTTTC CTCCGGCGCG TGACCGGGTA TGTCAAAGCC 
GTCGATGGTA TTGATTTCTA TATCAAGAAG GGTGAGACCC TCGGTCTCGT CGGTGAGTCA 
GGGTGCGGCA AGAGTACGAC CGGACGCACC ATCCTTCGCC TCCTCGATCC GACCGCAGGC 
GAGATTATTT TCGATGATCC GAATATTGGC AAGGTAGACC TGGCAAAACT CAATCGCGCG 
CAACTCACGC GGGTCCGCCC GAATATGCAG ATTATCTTCC AGGACCCCTT CTCGTCACTG 
AATCCGCGTC TGACGGTCGG GCAGATCGTT GGTGAACCGC TTGAAATCCA GAAGGTTGCT 
TCCGGTCAGG CGCTCAAGGA TCGCGTCGCT GAGTTGCTCC AGGAAGTCGG TATCCGCCCT 
GAGAATATGA CGCGCTACCC GCACGCTTTC TCCGGTGGGC AACGCCAACG TATCGGTATT 
GCGCGCGCCC TGGCGCTCAA CCCAAAACTG ATCGTCTGCG ATGAGCCGGT GTCGGCGCTC 
GATGTGTCGA TTCAGGCGCA GGTGCTCAAT CTTCTCGAAG ATCTTCAGGA GAAGTACGAC 
CTGACCTACC TCTTTGTGGC GCACGATCTG AGCGTTGTTG AACATATTTC CGACCGGGTG 
GCGGTGATGT ACGTGGGCTA TATCGTCGAA ATGGCAAGCA CCGAAGAACT CTATTACCAC 
CCCAAACATC CGTACACCGA GGCGCTCCTT GCTGCTATTC CGAAACCCGA TCCGCGCAAA 
CGCACGCGCC CGATCAAACT CCCTGGCGAC GTGCCCAGCC CGGCGAATCC TCCTTCGGGG 
TGCTATTTCC ATCCGCGCTG CCGGTATGCT GAGGAGATCT GTAAGGTCGA ACGTCCACCG 
CTGCGCGATA TTGGTGGTGA GCACTGGGTT GCCTGTCATT TCGCTGAGCA GTTGCAGTTG 
CAGGGTGTGA CGCGCCTGAA CGAAATCCCG CTCATTGAGC TTCCCAAGCG CCAGGCGTCT 
GTGCCGGCGA CAACGACAGC AACGACGTAG

Protein sequence

MDTAKKNGTS DEILLEVRGL KKHFPIQSGF LRRVTGYVKA VDGIDFYIKK GETLGLVGES 
GCGKSTTGRT ILRLLDPTAG EIIFDDPNIG KVDLAKLNRA QLTRVRPNMQ IIFQDPFSSL 
NPRLTVGQIV GEPLEIQKVA SGQALKDRVA ELLQEVGIRP ENMTRYPHAF SGGQRQRIGI 
ARALALNPKL IVCDEPVSAL DVSIQAQVLN LLEDLQEKYD LTYLFVAHDL SVVEHISDRV 
AVMYVGYIVE MASTEELYYH PKHPYTEALL AAIPKPDPRK RTRPIKLPGD VPSPANPPSG 
CYFHPRCRYA EEICKVERPP LRDIGGEHWV ACHFAEQLQL QGVTRLNEIP LIELPKRQAS 
VPATTTATT