Gene Rcas_2999 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_2999
Symbol
ID	5540495
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	+
Start bp	3892463
End bp	3893413
Gene Length	951 bp
Protein Length	316 aa
Translation table	11
GC content	66%
IMG OID	640895121
Product	LAO/AO transport system ATPase
Protein accession	YP_001433074
Protein GI	156742945
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1703] Putative periplasmic protein kinase ArgK and related GTPases of G3E family
TIGRFAM ID	[TIGR00750] LAO/AO transport system ATPase

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.0703569
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGACCTGG TACAGGCGTT GCTGTCCGGC CATCGGCGCG CGCTGGCACA GGCGCTGACC 
CTTGTGGAAA CCGGCGGTCC GCAGGCGCGC GCCCTTCTTG GCGCACTGTT CGCGCACACC 
GGTCGCGCGC ATATCATTGG CGTGACCGGC GCACCCGGCG CCGGTAAATC GACGCTGGTC 
ACCGCGCTGG CAGCGCACTG GCGGCGCACC GGTCGGACGG TTGGCATTAT TGCGGTCGAT 
CCGACGTCGC CATTCACGCG CGGCGCTCTT CTCGGCGACC GAATCCGCAT GCAGGCCCTC 
AGCGGCGATC CCGGCGTGTT TATTCGCAGT ATGGCAAGCC GCGGGCGGCT GGGGGGTATT 
GCCCGCGCCA CCGGCGATGC AGTGGCACTG CTCGACGCCG CCGGATTCGA TCTGGTGCTG 
ATCGAGACGG TCGGCGCCGG TCAGGGTGAG GTCGAGATCG CCGCGGCGGC TCATACCACA 
ATTGTTATCG AAATCCCCGG CGCCGGTGAT GATATTCAGG CTATCAAAGC CGGCATTCTC 
GAAATCGCCG ATGTGCTGGT GGTTAACAAA GCCGATCGCG ACGGCGCGGA ACAGACGGTT 
CGCCAGTTGC GCGCGATGCT GAGCCTGGCT GACCTGCCGG TTGACGGCTG GACCCCTCCG 
GTATTGACTG CTGTCGCTAT GCGCGGCGAA GGTATCGAAG CGATTGCGAC GGCAGCAGAG 
CGACATCTGG CCTATCTCCG CGAAAGCGAG CGCTTGACCC GGCGCGAGCA GGAACGCGCC 
GAGCGTGAAC TGCGGTTGAT CCTCCAGGAA ACAGCACTCG AGCGGGTGCG TGCGCATGTC 
GCGCCGTCTG ATTGGGAGGC ATTGATTGCC CAGATCGTCG CGCGCGCGCT CGATCCGTAT 
ACCGCTGCGA ATCGCCTGCT TGAGCGCGTG CTCCCACAGT CGGGCGGATA A

Protein sequence

MDLVQALLSG HRRALAQALT LVETGGPQAR ALLGALFAHT GRAHIIGVTG APGAGKSTLV 
TALAAHWRRT GRTVGIIAVD PTSPFTRGAL LGDRIRMQAL SGDPGVFIRS MASRGRLGGI 
ARATGDAVAL LDAAGFDLVL IETVGAGQGE VEIAAAAHTT IVIEIPGAGD DIQAIKAGIL 
EIADVLVVNK ADRDGAEQTV RQLRAMLSLA DLPVDGWTPP VLTAVAMRGE GIEAIATAAE 
RHLAYLRESE RLTRREQERA ERELRLILQE TALERVRAHV APSDWEALIA QIVARALDPY 
TAANRLLERV LPQSGG