Gene Rcas_0251 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_0251
Symbol
ID	5537713
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	-
Start bp	308356
End bp	309870
Gene Length	1515 bp
Protein Length	504 aa
Translation table	11
GC content	62%
IMG OID	640892415
Product	peptidase M1 membrane alanine aminopeptidase
Protein accession	YP_001430402
Protein GI	156740273
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0308] Aminopeptidase N
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	0
Plasmid unclonability p-value	0.000018463
Plasmid hitchhiking	No
Plasmid clonability	unclonable

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.187628
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAGCGAT CACCGAAAGC GCAAGCGTGG TCGGCTTCTC TGGCGCTGAT CGTGGCGATG 
CTCTGGCTCG GCGCCGCACC GCTCTCGGCA GCGCCGAGTG TCAGCGACCC GTTCACCGCG 
CCGCTCGATG TCCGGCGGCA GGAAGCAGCG CTTCTGCCCG CCTTCAGTGC CGATCTGAAC 
GCCGCCGAGC AATGGGATCG GTATACGGTG ATCGCTCGCG TTGATCCTGA AAAGCGCACA 
ATTTCCGGCA GACTGCGCCT GGAATATGCC AATCGCGCTG CCGATCCGCT CGACCGCATC 
TACTTTTATC TCTTTCCCAA TCTGCCGGAG TTTGGCGGAC GCCTCGACAT TCACAGCGCC 
ACCGTTGACG ATGTGGCAGT CCGGGTACGC TATGAATCGA AAAGGTTTCT GTTGCGGATC 
GACCTTCCTG CATCGCTTCC CTCTGGCGCT TCTACTGCTG TCGTCCTCGA TTTCAGCGCC 
GCTGCGCCGC TCGATGCCGG TCAGCGCTAT TATGCCGCCT TCAACCGCGA ACGCGGCGTG 
CTGGCGCTGG CATCGGCGCT GCCAATGGCG GCGCGGCACG TTGAGGGCGC CTGGCAACTG 
GCGACTCCTC TCTTCCGCGG CGATCTTGTG ACCGGTGACA CGGCGCTGTA CGATGTGACG 
CTCACCATCC CTGCCGCCTG GATTGCTGTG ACGACCGGGA CGGCAATCGA GAGCCAGAAT 
GACGGCGCCG TCCAAACTAC ACGCTTCGTC AGCGGTCCGC AGCGTGATTT TACCATTGTG 
CTCACCCGTT TCCCCTCGAT CTCCGCCGAG GTTGATGGCA CGCGCATCAC GTCGTATTTT 
CGCCCCGAGA ACCCGGAAGG CGGGCGTGCC GCGCTCGATG CCGCCGTCAA CGCGCTGCGC 
GTGTTCAATC GACGATTCGG ACCCTACCCG CTGACGGAAC TCGACATTGT TCAGATCGAT 
GCGCGCAAAT TTCTCGGCGT CGAGTACCCT GGTCTGATCA TGATCGACCG CCGATTGTAC 
GCTGGCGAGC GCGCAGGTCT GGAGATCATT GTGGCGCACG AAGTGGCGCA TCAGTGGTGG 
TATAGCATGG TCGGCAACGA TGTGCAGAAC GAAGCATGGC TCGACGAGGG GTTGACCTCG 
TTTACGCAGG TGGTCTATCA GGAAGAACTG CGTGGCGCCG CAGCAGCAGC GCGTGAGATC 
GACGGATTCC GCGCGACCTA TCTGCGCGCG CGGCAGACGG GTCGTGATGC GCCGCTGAAG 
CGCCCCGTGT CGGCGTTGCG CGGCAATTAT ACTGCTATTG CGTATGCGAA AGGGGCGCTT 
TTCTTTCAGG CGTTGCGTGT GCGGATCGGT GAACCGGCGT TCGACCGCTT TTTGCGCGAT 
TATTATGCCG CCTTTCGCTA CCGGATTGCG TCGAGCGACG ACGTGCGCGC TGTTGCCGAA 
AACGCCTGTG CCTGCGACCT CAACGATTTC TATCGGGATT GGGTGCTGAC GGCTGCGCCG 
GTTGCTGTGC CGTGA

Protein sequence

MQRSPKAQAW SASLALIVAM LWLGAAPLSA APSVSDPFTA PLDVRRQEAA LLPAFSADLN 
AAEQWDRYTV IARVDPEKRT ISGRLRLEYA NRAADPLDRI YFYLFPNLPE FGGRLDIHSA 
TVDDVAVRVR YESKRFLLRI DLPASLPSGA STAVVLDFSA AAPLDAGQRY YAAFNRERGV 
LALASALPMA ARHVEGAWQL ATPLFRGDLV TGDTALYDVT LTIPAAWIAV TTGTAIESQN 
DGAVQTTRFV SGPQRDFTIV LTRFPSISAE VDGTRITSYF RPENPEGGRA ALDAAVNALR 
VFNRRFGPYP LTELDIVQID ARKFLGVEYP GLIMIDRRLY AGERAGLEII VAHEVAHQWW 
YSMVGNDVQN EAWLDEGLTS FTQVVYQEEL RGAAAAAREI DGFRATYLRA RQTGRDAPLK 
RPVSALRGNY TAIAYAKGAL FFQALRVRIG EPAFDRFLRD YYAAFRYRIA SSDDVRAVAE 
NACACDLNDF YRDWVLTAAP VAVP