Gene Nmul_A2462 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmul_A2462
Symbol
ID	3786419
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosospira multiformis ATCC 25196
Kingdom	Bacteria
Replicon accession	NC_007614
Strand	+
Start bp	2810976
End bp	2812091
Gene Length	1116 bp
Protein Length	371 aa
Translation table	11
GC content	59%
IMG OID	637812553
Product	rhomboid-like protein
Protein accession	YP_413143
Protein GI	82703577
COG category	[R] General function prediction only
COG ID	[COG0705] Uncharacterized membrane protein (homolog of Drosophila rhomboid)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCTTTCAC TCCATGATCT TCTTCACCGG CAGGTTCCTC GAGTTCCGGT AACGAAGCTG 
CTGGTGTCGA CCAACCTGCT GATCTTTGTA GCCATGCTTG CCAGCGGAGC AGGCTTGTGG 
CACTCATCCA ATGGCGTACA ACTCGCCTGG GGCGCCAACT TCGGTCCCGC TACCCAGGAT 
GGGGAGTGGT GGCGCCTCGG GACCGCCATG TTCCTTCATT TTGGCCTGGT CCATCTCACC 
TTGAACCTCT GGGCGCTCTG GGATGCAGGC CAACTGGTTG AGCGCATGTA CGGGCACGCG 
CGCTTTACCG CCCTCTACTT TGCCAGCGGT CTTGCCGGCA ATCTGCTCTC GCTGGTTGCC 
CATAAAGGCT TGGCCATTTC CGGCGGCGCT TCGGGCGCCA TTTTCGGCCT ATATGGCGCC 
CTGCTGGTAT TTCTCTGGCG CGAGCGCGGC AGGCTGCATC CCCACGAGTT CCGATGGTTT 
TTCTGGGGCG CCACGGCTTT TGCAATTGTC AGCCTTGGGC TGGGCCTCGC AATTACCGGT 
ATCGATAACG CTGCTCATAT CGGCGGTTTC GTGACCGGTC TGCTCGGCGG AATAGTATTT 
GCAAACCCAA GGATGAACGA AAAGCCTTCT CATGTATTCA GCAGCCGCCT TTCCGCTATA 
AGCATTCTTG CACTGGCCGT CTTCATGCTG ATCGTTCGGA TTCCCCCTCC CGCCTATAAG 
TGGAGCGAGG AAGTATTGGC GCGCAAGGAA ATCGGCAATT TTCTGCGCGA TGACCGGGCG 
ATCACCCAGG CTTGGCAGCA TATACTCGAT GAGGCCAGGC GAGGAGGAAT CTCCTTTGAC 
GAACTGGCGG GGCAAATCGA TACTGCGGTG GGTAATCCCT ATGAAGAAAG CTTCGAGCAG 
CTTTCGGAAC TTCCCCCTGA TCCCGCATTG CCTTCTGCCG CTACGGTAGA AATGCTGCGA 
GACTACGCCG AACGCCGGAG GGATGCGTCC CGCGCCCTTG CGGAAGGTCT GCGCACTCAC 
AATCCCGCGC AAATCCGCCA CGCGCTGGAA ATGGCGAGGG AGCCGCTCCA GCTGCCCAAG 
CTCTCCCCGC CAACCCCGTC CGCCCTACCC CGCTGA

Protein sequence

MLSLHDLLHR QVPRVPVTKL LVSTNLLIFV AMLASGAGLW HSSNGVQLAW GANFGPATQD 
GEWWRLGTAM FLHFGLVHLT LNLWALWDAG QLVERMYGHA RFTALYFASG LAGNLLSLVA 
HKGLAISGGA SGAIFGLYGA LLVFLWRERG RLHPHEFRWF FWGATAFAIV SLGLGLAITG 
IDNAAHIGGF VTGLLGGIVF ANPRMNEKPS HVFSSRLSAI SILALAVFML IVRIPPPAYK 
WSEEVLARKE IGNFLRDDRA ITQAWQHILD EARRGGISFD ELAGQIDTAV GNPYEESFEQ 
LSELPPDPAL PSAATVEMLR DYAERRRDAS RALAEGLRTH NPAQIRHALE MAREPLQLPK 
LSPPTPSALP R