Gene Nmul_A1181 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmul_A1181
Symbol
ID	3784350
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosospira multiformis ATCC 25196
Kingdom	Bacteria
Replicon accession	NC_007614
Strand	-
Start bp	1360702
End bp	1362705
Gene Length	2004 bp
Protein Length	667 aa
Translation table	11
GC content	53%
IMG OID	637811266
Product	AsmA
Protein accession	YP_411876
Protein GI	82702310
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG2982] Uncharacterized protein involved in outer membrane biogenesis
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.256758
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGAGTGC GTACCAAGCA AATATTATCG ATCTCCGGCG TTGCACTGCT GCTGCTTGTC 
ATCGCATTCG TCCTGTGGTT CGACTGGAAT ATGCTGAAAC CATATATCGA ACGGCAGGTT 
ACCGAGAGGA CGGGCCGTGA ATTCACGATT CGGGGCGATC TCGATGTAAA CCTTTCGCTC 
AATCCCCTCG TCAGCGTTGA AGGACTTTCG CTAGCGAATG CCGAGTGGGG GACCGAACAA 
CCCATGGTTG CCGTGGATAA GGTTGCTGTG CGCATCAGTC TATGGGATCT CCTGTCCGGC 
GATATCGTGT TGCCCGAGCT ATCCATCACG CGGCCCCGGG TACTCCTGGA AAAAAGCATG 
GATGGAAAGC GAAACTGGGA TCTGAAAAAA GAAGAAAAAA AGAAGATGGA ACTGCCTCAA 
ATTGGCCAAT TCACCCTGGA TCAGGGAAAA GTTCTCTTCC GCGATCCGAA GACCAAGACA 
GATATAGCAG CCGACGTATT CACGGATCCG GCGGTGGACG CCGGAGAATT GCCCCTTCAT 
GTGGCAGCGG AAGGTAAATT TACCGACCTG AAATTCACCG CGCAAGCGCA AGGCGGCAAG 
ATAATGTCGC TTGCGGATAA GACTATCCCC TATCCGATCA AAGCGAGTGC CGAGATGGGA 
ACAACGCGCG CAAGCGCGGA TGGAACCATC AAAGGGCTGG CCGAGATGGC GGAAGTGGAT 
CTGAAGCTGG ACTTACACGG AGAGGATTTA TCTGCGCTCT ACCCCGTAAC CGGCATCGTT 
ATTTTCCCCT CCCCCCCGTA CCACATTTCC GGAAGGATTT TGCACCACGA TACCGAGTGG 
TCCATGAAGG GATTTTCCGG AAATGTAGGC AACAGCGATC TTGGCGGGGA TATCGTATTC 
GACACGGGAG GCGAGCGGCC GCTCCTTCGA GGCGACGTGG TATCCAAAGT ACTCGACCTG 
AGCGATTTGC AAGGTTTTAT TGGGGCGCGG CGAGGCCCCC AACCACAGGA TACGCCTGCG 
GAAAAGAAAG AAAAAAAGGA ATCAATGAAG AAACAGCGGC ATCGTCTTCT ACCAGACCAG 
GAATTCCGGA TAGACCGTTT GAAAGCCATG GACGCAGACG TAAGGTTCAC TGGAGAATCG 
ATCCGCAACA AGGAACTGCC GGTGAAGCAT ATCGTGAGCC ACTTGAAAAT AGACAACGGG 
CTTCTGACCC TCAACCCCGT CAACTTTGCG GTGGCGGGTG GGAATATCAT TTCGAATATC 
ACAATCAACA CGCGTCCCGA AGTGCCCAAG GGAGAAATCA AAGTCGACGT CAAGCGCCTG 
CAATTGCAAA AGCTCTTTCC TAAGCTCGAA ATCACGAAGA ATAGTGCAGG TGTAATCGGC 
GGTGCAATAG ACATTAATAG CCACGGCAAG TCCGTCGGCG CGCTGCTGGC TTCGGCCGAT 
GGAAACTTTG GCCTGATCAT GTCCGGCGGC CAGATCAGCA AGCTGTTGCT GGAAGTGATC 
GGACTTGATG GGGGGCAGAT CATCAAGCTC CTGTTTGCCG GAGACAAAAA CGTGCCGGTG 
CGGTGCGGGG TAATCGACTT TGATATCAAG AAAGGCATCA TGAGCAGCAA AGCTTTCGTC 
ATCGACACGA CCGATACCAA AATTGTCGCT AAAGGACAGA TAAGCCTGGC TGAAGAAAAG 
ATTGACATGA AGCTGTCTCC CAAAGCCAAG GATGTCAGCA TCCTGAGCCT TCGCACCCCT 
ATTCACATAG AAGGCACTTT CAAGGATCCC ACAATCCTTC CCGACAAGAT ACTTGCCATA 
CGGGCGGGAG CAGCGGTCGT ACTGGGAGTT CTTGCGACAC CTCTAGCAGC GCTCATCCCG 
ACCATTGAAA CCGGACTGGC CAAAGATGCC AATTGCAGGG CATTGATTGC TTCAGTGGAA 
ACGCCAGCGA AGCGCGCGGC TGGAGTCAAA GATAAGAAAG ATGAGGATCA TCCCCCGGCG 
TCCCAGACGT CCCGGTCAAA GTAA

Protein sequence

MRVRTKQILS ISGVALLLLV IAFVLWFDWN MLKPYIERQV TERTGREFTI RGDLDVNLSL 
NPLVSVEGLS LANAEWGTEQ PMVAVDKVAV RISLWDLLSG DIVLPELSIT RPRVLLEKSM 
DGKRNWDLKK EEKKKMELPQ IGQFTLDQGK VLFRDPKTKT DIAADVFTDP AVDAGELPLH 
VAAEGKFTDL KFTAQAQGGK IMSLADKTIP YPIKASAEMG TTRASADGTI KGLAEMAEVD 
LKLDLHGEDL SALYPVTGIV IFPSPPYHIS GRILHHDTEW SMKGFSGNVG NSDLGGDIVF 
DTGGERPLLR GDVVSKVLDL SDLQGFIGAR RGPQPQDTPA EKKEKKESMK KQRHRLLPDQ 
EFRIDRLKAM DADVRFTGES IRNKELPVKH IVSHLKIDNG LLTLNPVNFA VAGGNIISNI 
TINTRPEVPK GEIKVDVKRL QLQKLFPKLE ITKNSAGVIG GAIDINSHGK SVGALLASAD 
GNFGLIMSGG QISKLLLEVI GLDGGQIIKL LFAGDKNVPV RCGVIDFDIK KGIMSSKAFV 
IDTTDTKIVA KGQISLAEEK IDMKLSPKAK DVSILSLRTP IHIEGTFKDP TILPDKILAI 
RAGAAVVLGV LATPLAALIP TIETGLAKDA NCRALIASVE TPAKRAAGVK DKKDEDHPPA 
SQTSRSK