Gene M446_3581 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	M446_3581
Symbol
ID	6134182
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium sp. 4-46
Kingdom	Bacteria
Replicon accession	NC_010511
Strand	-
Start bp	3998050
End bp	3999264
Gene Length	1215 bp
Protein Length	404 aa
Translation table	11
GC content	73%
IMG OID	641643748
Product	cysteine desulfurase NifS
Protein accession	YP_001770396
Protein GI	170741741
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1104] Cysteine sulfinate desulfinase/cysteine desulfurase and related enzymes
TIGRFAM ID	[TIGR03402] cysteine desulfurase NifS

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.157563
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.0285875
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCGCGA CCCACACCAC GGCCTATCTC GACAACAACG CCACCACCCG GGTCGATTCC 
CGGGTCGTGG AGGCCATGCT CCCGTTCCTC ACCGAGCATT TCGGCAACGC CTCCTCCATG 
CACGCCTTCG GGGCGGCGGT GGGCGGGGCC GTGCGGGCGG CGCGGGGCGA GGTCCAGGCG 
CTGCTCGGCG CCGCCCACGA TTCCGAGATC GTCTTCACCT CGGGCGGCAC CGAGAGCGAC 
AACACCGCGA TCCTCTCCGC CCTGGAGGTG AGCCCGCGGC GGCGGGAGAT CGTCACCAGC 
GCGGTCGAGC ACCCGGCCGT GCTCTCCCTG TGCAGCCACC TGGAGAAGAA CCGGGGCATC 
AAGGTCCACG TCATCCCGGT CGACGGGAAG GGGCGGCTCG ACCGGGCGGC CTACAGCGCG 
GCCCTGTCGG AGCGGGTCGC CGTGGTGTCG ATCATGTGGG CCAACAACGA GACCGGGACG 
ATCTTCCCGG TCGCGGACCT CGCCGAGGAG GCGAAGGCGC ACGGGGCGAT GTTCCACACC 
GACGCGGTGC AGGCGGTGGG CAAGGTGCCG ATCGACCTCA AGGCGACGGC GATCGACATG 
CTGTCGCTCT CGGCCCACAA GCTGCACGCG CCGAAGGGCG TCGGGGCGCT CTACCTGCGG 
CGCGGCCTGC GCGTCCGGCC GCTCCTGCGC GGCGGCCACC AGGAGCGGGG CCGGCGCGCC 
GGCACCGAGA ACATCCCGGG CATCGTCGCC CTCGGCGCGG CGGCGCGGAT CGCCGCGGAG 
GGGCTCGCCG CGGACGCGAT CCGGGTCGGC GCCCTGCGCG ACCGGCTGGA GAAGGGCCTG 
CTGCAGCGCA TCCCGCACTG CTTCGTCACC GGCGACCCGG ATCACCGCCT GCCCAACACC 
GCCAACGTCG CCTTCGCGTA TATCGAGGGC GAGGGCATCC TGCTCCTGCT CAACCGGGCG 
GGGATCGCCG CCTCCTCGGG CTCGGCCTGC ACCTCGGGCT CGCTCGAACC CTCCCACGTG 
CTGCGCGCCA TGAAGGTGCC CGCCACGGCG GCGCACGGGG CGATCCGCTT CTCGCTCTCG 
CGCGAGACGA CGGGCGAGGA GGTCGACCGG GTGCTCGAGG CCATGCCGGG CATCGTCGGC 
AAGCTGCGCG ACCTGTCCCC GTTCTGGAGC GGGACGGGAA GCGAGGCCGC GTCCTTCAAT 
CCCGTCTACG CCTGA

Protein sequence

MTATHTTAYL DNNATTRVDS RVVEAMLPFL TEHFGNASSM HAFGAAVGGA VRAARGEVQA 
LLGAAHDSEI VFTSGGTESD NTAILSALEV SPRRREIVTS AVEHPAVLSL CSHLEKNRGI 
KVHVIPVDGK GRLDRAAYSA ALSERVAVVS IMWANNETGT IFPVADLAEE AKAHGAMFHT 
DAVQAVGKVP IDLKATAIDM LSLSAHKLHA PKGVGALYLR RGLRVRPLLR GGHQERGRRA 
GTENIPGIVA LGAAARIAAE GLAADAIRVG ALRDRLEKGL LQRIPHCFVT GDPDHRLPNT 
ANVAFAYIEG EGILLLLNRA GIAASSGSAC TSGSLEPSHV LRAMKVPATA AHGAIRFSLS 
RETTGEEVDR VLEAMPGIVG KLRDLSPFWS GTGSEAASFN PVYA