Gene Arth_2768 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_2768
Symbol	hemH
ID	4444567
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008541
Strand	-
Start bp	3119960
End bp	3121240
Gene Length	1281 bp
Protein Length	426 aa
Translation table	11
GC content	66%
IMG OID	639690590
Product	ferrochelatase
Protein accession	YP_832247
Protein GI	116671314
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0276] Protoheme ferro-lyase (ferrochelatase)
TIGRFAM ID	[TIGR00109] ferrochelatase

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.00310189
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCCCGC TTGAATCACA GGAGGCACCG GCCTCGGTGA CGGCCGTCAA CCCGGTCACC 
GAATCCGGGC GTATGGCTCC GAAGGAATAC GACGCCGTCC TCCTCGCCTC ATTCGGCGGG 
CCTGAGGGCC AGGATGACGT CATCCCCTTC CTCCGCAATG TCACCCGGGG GCGCGGAATC 
CCCGACGAAC GGCTTGAAGA GGTTTCGCAC CACTACCGTG CCAACGGGGG CATCAGCCCG 
ATCAACCAGC AGAATCGCGA GCTCAAGGCC GGGATCGAAG CGGAACTCTC GGCCAGGGGC 
ATCAACCTGC CCGTTTTCTG GGGCAACCGC AACTGGGACC CCTACATTCC GCAGACCCTC 
CAGGACGTGT ACGACGCCGG CCACCGCAAG GTCCTCATGG TCACCACGAG CGCCTACTCC 
TGCTATTCCA GCTGCCGCCA GTACCGCGAG GACATCGGCA TGGCGCTGAC CGAGACCGGC 
CTGGACGGGA AGCTGGAAGT GGACAAAGTC CGCCAGTACT TCGACCACCC GGGCTTCGTG 
GAGCCCTTCG TGGAAGGGAC CGCTGCCGGC CTTGCCGACG TCCGCGCCCA GCTTGCCGCG 
GTTGGTACTC CGGACGCACC GGTCCACATC CTGTTCGCCA CGCACTCCAT TCCGACGCGT 
GACGCTGAAG CTGCCGGACG CTCCGAGGGT GAACCGCGCA CCTTCGCTGA AGGCTCGGCC 
TACGTGGCGC AGCACCTGGC ATCCGGCGCC GAGGTCATCC GACGTGTCGA GGAAGAATCG 
GGCCTGACCG CCCCATGGTC CCTCGTTTAC CAGTCCCGTT CCGGTGCTCC GTCCGTTCCG 
TGGCTCGAAC CGGACATCAA CGACGCCATC GAGGAGCTTG CCGGCGAGGG TGTCAAGGGA 
ATCGTGATCG TCCCCCTGGG TTTCGTCAGC GACCACATGG AGGTTGTCTG GGACCTGGAC 
ACCGAAGCGC TGGAAACGTG CCGCAACCTT GGCCTGTCCG CAACCCGGGT GCCCACCCCC 
GGCACGCACC GCAAATTCGT GAGCGGCATC GTGGACCTGG TCTGTGAGCG CACTGCCGCG 
AACAATATTG CCGACCGGCC GCACCTCACC GACCTGGGGC CCTGGTATGA CGTCTGCCGC 
CCCGGCTGCT GCGCCAACTT CCGGGGCGAG AAGCCCACCA TCGCAGGAGC TGACACCTCA 
GTGGGCACAG GCCACGCCTC CTACCCTTCT GGTTCGGCTG ACACTCCGGC TGCCCAGGCG 
GCGGGACAGG ACTCACTGTG A

Protein sequence

MSPLESQEAP ASVTAVNPVT ESGRMAPKEY DAVLLASFGG PEGQDDVIPF LRNVTRGRGI 
PDERLEEVSH HYRANGGISP INQQNRELKA GIEAELSARG INLPVFWGNR NWDPYIPQTL 
QDVYDAGHRK VLMVTTSAYS CYSSCRQYRE DIGMALTETG LDGKLEVDKV RQYFDHPGFV 
EPFVEGTAAG LADVRAQLAA VGTPDAPVHI LFATHSIPTR DAEAAGRSEG EPRTFAEGSA 
YVAQHLASGA EVIRRVEEES GLTAPWSLVY QSRSGAPSVP WLEPDINDAI EELAGEGVKG 
IVIVPLGFVS DHMEVVWDLD TEALETCRNL GLSATRVPTP GTHRKFVSGI VDLVCERTAA 
NNIADRPHLT DLGPWYDVCR PGCCANFRGE KPTIAGADTS VGTGHASYPS GSADTPAAQA 
AGQDSL