Gene Rcas_3075 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_3075
Symbol
ID	5540571
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	+
Start bp	3981384
End bp	3982751
Gene Length	1368 bp
Protein Length	455 aa
Translation table	11
GC content	63%
IMG OID	640895194
Product	argininosuccinate lyase
Protein accession	YP_001433147
Protein GI	156743018
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0165] Argininosuccinate lyase
TIGRFAM ID	[TIGR00838] argininosuccinate lyase

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTGGGGCG GTCGTTTCGA CGAAGGCATT GACGCGCGCA TGGCGCGGTT CAACAACTCG 
TTCCCGTTCG ATCAGCGCAT GTGGCGCGAG GATATTCGCG GAAGCATGGC GTGGGCGCGT 
CAACTCGCAC AGGCAGGAGT CATATCGACG GAAGAGCGCG ACACACTGCT GACGGGTCTT 
GAGACGGTCT TTGCTGAGTT TGCCAATGAT CGATTCGAGG CGCGACCAAC TGACGAAGAC 
ATTCACACTG CCATCGAGCG CCGTCTGGGA GAACTCGTTG GCGCAGTCGC CGGAAAACTT 
CACACCGGGC GCAGCCGCAA TGATCAGGTG GCGACCGATG TGCGACTCTG GACGATGGGT 
GCAATCCAGC GCATCGATGA CGGCGTGCGG GCGCTGCAAC AGGCGCTGCT GACGCAGGCA 
GAAGCCGCCG GCGACGCGCT GATGCCCGGC TATACGCATC TGCAACGCGC CCAACCGGTG 
TTGCTGGCGC ACTGGCTGCT CTCACACTTC TGGTCTGCGC AACGCGACCG TGAACGCCTG 
ACGGATTGCG CAAAACGAAC GTCAGTGCTG CCGCTCGGCT CAGGCGCCAT CGCCGGCACG 
CCACTGGCAA TCGATCGCGC AGCGCTCGCC GCCGATCTGG GAATGGCAGC GATTTCTCCA 
AACAGCATCG ACGCTGTCAG CGATCGTGAT TTCGTTGCCG AATTTCTGTT CTGCGCGGCG 
CTGATCGGCA TACATCTCAG CCGTCTGGCG GAAGACATGA TCATTTACAG CAGCGCCGAG 
TTCGGTTTCG TCGTTCTCGC CGACGCCTAC AGCACTGGAT CGAGTCTGAT GCCGCAGAAG 
AAAAACCCTG ATTCGTTCGA ACTGCTCCGC GGCAAAGCCG GGCGTCTCAC CGGCGACCTG 
GTCACGGTGC TGACCGTGCT GAAAGGGATA CCGTCCGCCT ACGACAAAGA CTTGCAGGAA 
GACAAAGAGC CGCTGTTCGA CGCCGCCGAC ACCCTCGAAC TGGCGCTGCC GGTCGCTGCC 
GGGGCAGTCG CAACGGCTCG CTTCCGTCAC GACCGCATGC GCGCGGCGCT CGATGATGCG 
ATGCTGGCTA CCGATGCCGC CGATTACCTG GTGGCGCGCG GCGTACCATT CCGCGAAGCG 
CACCATGTGG TTGGCAGGCT GGTGCGTGAG GCGGAGCAAC GTGGGGTTGC GCTCTCGGCG 
CTGCCGCTCG ATATACTCCT GGCGGCGCAT CCGGCCTGCG GCAGCGATAT TCTTCAGGTG 
TTCGACATGG ATCGCTCTGC GGCGCAGCGT CGCGTTCCGG GCGCAACCGC GCCGGGATCC 
GTGCGCGAAC AGATCATCCG GGCGCGGCAG TGTCTTGGGG AACATTGA

Protein sequence

MWGGRFDEGI DARMARFNNS FPFDQRMWRE DIRGSMAWAR QLAQAGVIST EERDTLLTGL 
ETVFAEFAND RFEARPTDED IHTAIERRLG ELVGAVAGKL HTGRSRNDQV ATDVRLWTMG 
AIQRIDDGVR ALQQALLTQA EAAGDALMPG YTHLQRAQPV LLAHWLLSHF WSAQRDRERL 
TDCAKRTSVL PLGSGAIAGT PLAIDRAALA ADLGMAAISP NSIDAVSDRD FVAEFLFCAA 
LIGIHLSRLA EDMIIYSSAE FGFVVLADAY STGSSLMPQK KNPDSFELLR GKAGRLTGDL 
VTVLTVLKGI PSAYDKDLQE DKEPLFDAAD TLELALPVAA GAVATARFRH DRMRAALDDA 
MLATDAADYL VARGVPFREA HHVVGRLVRE AEQRGVALSA LPLDILLAAH PACGSDILQV 
FDMDRSAAQR RVPGATAPGS VREQIIRARQ CLGEH