Gene Tery_4133 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tery_4133
Symbol
ID	4245647
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Trichodesmium erythraeum IMS101
Kingdom	Bacteria
Replicon accession	NC_008312
Strand	+
Start bp	6375963
End bp	6377432
Gene Length	1470 bp
Protein Length	489 aa
Translation table	11
GC content	41%
IMG OID	638109034
Product	nitrogenase cofactor biosynthesis protein NifB
Protein accession	YP_723614
Protein GI	113477553
COG category	[R] General function prediction only
COG ID	[COG0535] Predicted Fe-S oxidoreductases
TIGRFAM ID	[TIGR01290] nitrogenase cofactor biosynthesis protein NifB

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.250662
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTACAGC CAACAGAAGT ATCTTCCCAA CCAACAGTAA ACAGCTTCGC AAACATGATA 
GCAACTCCAG AAAAACAACC TGGTGATTGC GCGTCAAAGG GTTGCGGAAG CAACGAACAA 
GAAGTTGCCT CCAGTATTCA AGAGCGCATT GCTAATCATC CTTGTTATAG TCAAGAAGCG 
CATCACCACT ATGCAAGGAT GCACGCTCCA GTTGCACCAG CTTGCAACAT TCAATGTAAT 
TTCTGTAACC GGAAATACGA CTGTGCCAAT GAAAGTCGTC CCGGTGTAGT CAGTGAACTG 
CTAACTCCTG AAGAAGCAGC TCACAAAGCT CTAGTAATTG CTGGAAAAAT TCCGCAAATG 
ACAGTGATGG GTATTGCTGG CCCTGGCGAC CCATTAGCGA ACCCAGAAAA AACATTTCGT 
ACTTTTGAGC TTGTAGCTGA GAAAGCTCCA GATATCAAGC TTTGCTTGTC AACCAATGGT 
CTAGCTTTAC CTGATCATAT AGATCGGATT AAAGCATTAA ATATTGACCA CGTTACTATA 
ACAATTAATA TGGTTGACCC TGAAATCGGG GTAAAGATTT ATCCTTGGGT TCACTACAAA 
CGGAAGCGCT ATAGAGGAAT TGAGGGAGTC AAAATTCTGC ATCAAAAGCA AATGGAAGCT 
TTAGACTTGC TCAGAGAAGC TGATGTTCTC TGCAAAGTTA ACTCAGTGAT GATTCCTGGT 
ATTAATGACA AACACCTAGA AGAAGTTAAT AGGGTTGTTC GCTCGAAGGG TGCATTCATT 
CATAACATTA TGCCTCTAAT TTCTTCACCA GAACATGGTA CTTACTTCGG TTTAAATGGT 
CAACGTGGCC CAACTACTGA AGAACTAAAA GAATTACAAG ACAAATGTGA TGTTGGTGGT 
ATGAACATGA TGCGTCACTG TCGTCAATGT CGTGCAGATG CAGTTGGTCT TTTAGGTGAA 
GACCGTAGTA AGGAATTCAC AAAAGAAGCG ATCATGGAAA TGACTCCAGA GTATGATCTA 
CAAAAGCGCA AAGAATTTCA TGCTGGCATT GAAGGTTTCC GCAGTAAACT AGTAAAGGCT 
AAGGCTTCAG GTCAAACTAC TGAAAAAGTT GCCGAAGCTG GTCCGCCCAT ACTACTGGCA 
GTAGCAAGTA AGGGTAACGG ATTAGTTAAT CAGCACTTTG GTCATGCTAA AGAGTTTATG 
ATCTATGAAG TAGATGGTGT GAAAGCTAGA TTTATTGCTC ACCGGAAAGT TGACCACTAT 
TGTCTAGGTG GTTATGGTGA AGAAGGAAGT CTGGAGAATA TCATCAAGGC AATTTCTGAT 
TGTAAAGCTG TTTTTGTTTC TAAAATTGGT GAGAGTCCAA AGGAAAAGGT ACGCAATGCA 
GGACTAAAGG TGGTTGAAAC TTACGATGTA ATTGAAACAG TTGCTTTAGA TTTCTATAAG 
CAATTCATCG GACAACTACA AGTAGCATAG

Protein sequence

MLQPTEVSSQ PTVNSFANMI ATPEKQPGDC ASKGCGSNEQ EVASSIQERI ANHPCYSQEA 
HHHYARMHAP VAPACNIQCN FCNRKYDCAN ESRPGVVSEL LTPEEAAHKA LVIAGKIPQM 
TVMGIAGPGD PLANPEKTFR TFELVAEKAP DIKLCLSTNG LALPDHIDRI KALNIDHVTI 
TINMVDPEIG VKIYPWVHYK RKRYRGIEGV KILHQKQMEA LDLLREADVL CKVNSVMIPG 
INDKHLEEVN RVVRSKGAFI HNIMPLISSP EHGTYFGLNG QRGPTTEELK ELQDKCDVGG 
MNMMRHCRQC RADAVGLLGE DRSKEFTKEA IMEMTPEYDL QKRKEFHAGI EGFRSKLVKA 
KASGQTTEKV AEAGPPILLA VASKGNGLVN QHFGHAKEFM IYEVDGVKAR FIAHRKVDHY 
CLGGYGEEGS LENIIKAISD CKAVFVSKIG ESPKEKVRNA GLKVVETYDV IETVALDFYK 
QFIGQLQVA